Límites de frecuencia y cuotas

Haz clic en tu proveedor de Gemini API para ver el contenido específico del proveedor y el código en esta página.


Los límites de frecuencia (que suelen llamarse cuotas) regulan la cantidad de solicitudes que puedes realizar a la Gemini API dentro de un período determinado. Estos límites ayudan a garantizar un uso justo, proteger contra el abuso y mantener el rendimiento del sistema para todos los usuarios.

Cuando usas Firebase AI Logic para enviar solicitudes a Gemini y Imagen modelos, los límites de frecuencia de tu proyecto dependen del proveedor de la "Gemini API" que elijas. Firebase AI Logic también proporciona una forma de establecer límites de frecuencia "por usuario".

Consulta los límites de frecuencia de la Gemini Developer API

Si superas tu cuota o si se agota la capacidad del modelo al que accedes, recibirás un mensaje de error 429.

Cómo funcionan los límites de frecuencia (cuotas)

Los límites de frecuencia (cuotas) se miden en cuatro dimensiones:

  • Solicitudes por minuto (RPM)
  • Solicitudes por día (RPD)
  • Tokens por minuto (TPM)
  • Tokens por día (TPD)

Tu uso se evalúa en función de cada límite, y si superas alguno de ellos, se activará un error 429 de cuota excedida. Por ejemplo, si tu límite de RPM es de 20, realizar 21 solicitudes en un minuto generará un error, incluso si no superaste tus TPM ni otros límites.

Los límites de frecuencia se aplican a nivel del proyecto y se aplican a todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.

Los límites varían según el modelo específico que se use, y algunos límites solo se aplican a modelos específicos. Por ejemplo, las imágenes por minuto (IPM) solo se calculan para los modelos capaces de generar imágenes (Imagen), pero son conceptualmente similares a los TPM.

Los límites de frecuencia son más restringidos para los modelos experimentales y de vista previa.

Solicita un aumento del límite de frecuencia

Si usas un "nivel pagado" para el Gemini Developer API, puedes solicitar un aumento del límite de frecuencia.

Establece límites de frecuencia "por usuario"

Para usar Firebase AI Logic, tu proyecto necesita que esté habilitado el proveedor de Gemini API que elegiste, pero también necesitas que esté habilitada la API de Firebase AI Logic, que actúa como una puerta de enlace entre nuestros SDKs de cliente y tu Gemini API proveedor. Esta API se habilita cuando configuras Firebase AI Logic por primera vez en tu proyecto de Firebase.

Puedes usar el límite de frecuencia (cuota) de la API de Firebase AI Logic como un límite de frecuencia "por usuario" para tu app, específicamente para las funciones potenciadas por IA que dependen de Firebase AI Logic. Debes establecer este límite para que se adapte de manera razonable a un solo usuario que acceda a tus funciones potenciadas por IA, y, al mismo tiempo, asegurarte de que ningún usuario único supere los límites de tu Gemini API proveedor (que está destinado a ser compartido por todos tus usuarios).

Detalles sobre el límite de frecuencia "por usuario"

Estos son algunos detalles importantes sobre los Firebase AI Logic límites de frecuencia (cuotas) de la API , específicamente, las solicitudes por minuto (RPM):

  • Se basa en las "solicitudes de generación de contenido" por usuario, por región y por minuto, y no se basa en el modelo.

  • Es el límite de frecuencia que se aplica a todos tus usuarios. Actualmente, no hay forma de establecer el límite de frecuencia para un usuario específico o un grupo de usuarios específico*.

  • Se aplica a nivel del proyecto y se aplica a todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.

  • Se aplica a cualquier llamada que provenga específicamente de cualquier Firebase AI Logic SDK.

  • El límite de frecuencia predeterminado es de 100 RPM por usuario.
    Ten en cuenta que aún debes considerar los límites de tu proveedor de Gemini API (consulta más arriba), que tienen prioridad sobre la API de Firebase AI Logic.

* Si usas la Vertex AI Gemini API y tu app dirige a los usuarios a diferentes regiones (por ejemplo, con Firebase Remote Config), puedes establecer un límite de frecuencia específico para los usuarios de una región específica.

Ajusta el límite de frecuencia "por usuario"

Para ajustar un límite de frecuencia (cuota), debes tener el permiso serviceusage.quotas.update, que se incluye de forma predeterminada en los roles Propietario y Editor.

A continuación, te indicamos cómo editar tu límite de frecuencia (cuota) o solicitar un aumento:

  1. En la consola Google Cloud, ve a la página de la Firebase AI Logic API.

  2. Haz clic en Administrar.

  3. Más abajo en la página, haz clic en la pestaña Cuotas y límites del sistema.

  4. Filtra la tabla para mostrar las cuotas de interés, como la capacidad (solicitudes para generar contenido) y la región.

    Por ejemplo, para ver las cuotas por usuario para generar solicitudes de contenido en cualquiera de las regiones asiáticas admitidas, tu filtro se vería de la siguiente manera: así: Generate content requests + Dimension:region:asia

  5. Selecciona la casilla de verificación a la izquierda de cada cuota de interés.

  6. Al final de la fila de la cuota, haz clic en , y, luego, selecciona Editar cuota.

  7. En el formulario Cambios de cuota, haz lo siguiente:

    1. Ingresa la cuota aumentada en el campo Valor nuevo.

      Esta cuota se aplica a nivel del proyecto y se comparte entre todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.

    2. Completa los campos adicionales del formulario y, luego, haz clic en LISTO.

    3. Haz clic en Enviar solicitud.