Vertex AI in Firebase requiere dos APIs diferentes (cada una con su propia cuota): la API de Vertex AI y la API de Vertex AI in Firebase.
Cada una de estas APIs tiene una cuota que se mide como solicitudes por minuto (RPM), específicamente, solicitudes de "generación de contenido" (con y sin transmisión). La API de Vertex AI también tiene una cuota de tokens de entrada por minuto.
En esta página, se describe lo siguiente:
Información sobre las cuotas de la API de Vertex AI y la API de Vertex AI in Firebase
Cómo ver las cuotas en la consola de Google Cloud
Puedes obtener información general sobre las cuotas en la documentación de Google Cloud.
Comprende las cuotas de cada API
La cuota de cada API se mide de forma ligeramente diferente, lo que significa que se pueden usar para diferentes fines.
Comprende las cuotas de la API de Vertex AI
Las cuotas de la API de Vertex AI se basan en la acción "Generar solicitudes de contenido" por modelo, por región y por minuto.
A continuación, se incluyen algunos detalles importantes sobre estas cuotas (en particular, las solicitudes por minuto y los tokens de entrada por minuto):
Se aplican a nivel del proyecto y se comparten entre todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.
Se aplican a cualquier llamada a Vertex AI Gemini API, ya sea con los SDK de cliente Vertex AI in Firebase, los SDK de servidor Vertex AI, Firebase Genkit, Firebase Extensions de Gemini, llamadas REST, Vertex AI Studio o cualquier otro cliente de API.
Se aplican a un modelo base y a todas las versiones, identificadores y versiones ajustadas de ese modelo. Estos son algunos ejemplos:
Una solicitud a
gemini-1.0-pro
y una solicitud agemini-1.0-pro-001
se cuentan como dos solicitudes a la cuota de RPM del modelo base,gemini-1.0 pro
.Una solicitud a
gemini-1.0-pro-001
y una solicitud a un modelo ajustado que se basa engemini-1.0-pro-001
se cuentan como dos solicitudes a la cuota de RPM del modelo base,gemini-1.0-pro
.
Puedes encontrar las cuotas predeterminadas para cada modelo y cada región en la documentación de Google Cloud.
Básicamente, puedes considerar que las cuotas de esta API son tus cuotas "totales" para todos tus usuarios (que usan las funciones de IA de tu app que dependen de un modelo específico y en una región específica).
Estas cuotas deben ser lo suficientemente altas como para adaptarse de manera razonable a la cantidad total de usuarios finales en una región específica que podrían acceder a tus funciones de IA que dependen de un modelo específico. Dado que se trata de cuotas por minuto, es poco probable que todos los usuarios de una región usen el mismo conjunto de funciones al mismo tiempo y agoten estas cuotas. Sin embargo, cada app es diferente, por lo que debes ajustar estas cuotas según corresponda.
Comprende la cuota de la API de Vertex AI in Firebase
La cuota de la API de Vertex AI in Firebase se basa en la función "Generar solicitudes de contenido" por usuario, por región y por minuto.
Estos son algunos detalles importantes sobre esta cuota (en particular, las solicitudes por minuto):
Se aplica a nivel del proyecto y a todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.
Se aplica a cualquier llamada que pase específicamente por cualquier SDK de Vertex AI in Firebase.
La cuota predeterminada es de 100 RPM por usuario.
Ten en cuenta que aún debes considerar los límites de cuota de la API de Vertex AI, especialmente si son inferiores a estas 100 RPM.
Básicamente, puedes considerar que la cuota de esta API es tu cuota "por usuario" para las funciones de IA que dependen de Vertex AI in Firebase.
Esta cuota debe ser lo suficientemente alta como para admitir de manera razonable un solo usuario que acceda a las funciones de IA que dependen de Vertex AI in Firebase. Dado que esta API actúa como puerta de enlace a la API de Vertex AI, puedes usar la cuota de la API de Vertex AI para asegurarte de que ningún usuario agote tu cuota de la API de Vertex AI (que está destinada a ser compartida por todos tus usuarios).Vertex AI in Firebase
Consulta las cuotas de cada API
Puedes ver las cuotas de cada API en la consola de Google Cloud.
En la consola de Google Cloud, ve a la página de la API de interés: API de Vertex AI o API de Vertex AI in Firebase.
Haz clic en Administrar.
Más abajo en la página, haz clic en la pestaña Cuotas y límites del sistema.
Filtra la tabla para mostrar las cuotas de interés.
Ten en cuenta que, para crear un filtro
Dimension
, debes usar las herramientas de filtro, en lugar de copiar y pegar los valores de los siguientes ejemplos.Para la API de Vertex AI: Especifica la capability (solicitudes para generar contenido), el nombre del modelo y la región.
Por ejemplo, para ver las cuotas para generar solicitudes de contenido con Gemini 1.5 Flash en cualquiera de las regiones de la UE compatibles, tu filtro se vería de la siguiente manera:
Generate content requests
+Dimension:base_model:gemini-1.5-flash
+Dimension:region:eu
Para la API de Vertex AI in Firebase: Especifica la capability (solicitudes para generar contenido) y la región.
Por ejemplo, para ver las cuotas por usuario para generar solicitudes de contenido en cualquiera de las regiones asiáticas admitidas, tu filtro se vería de la siguiente manera:
Generate content requests
+Dimension:region:asia
Ten en cuenta que las cuotas de la API de Vertex AI in Firebase no se basan en un modelo en particular. Además, la fila de cuota de
(default)
no se aplica a Vertex AI in Firebase.
Edita la cuota o solicita un aumento
Antes de pasar a producción o si recibes errores de cuota excedida 429, es posible que necesites editar tu cuota o solicitar un aumento. Asegúrate de ajustar la cuota de cada API según corresponda (consulta Información sobre las cuotas de cada API más arriba en esta página para conocer las consideraciones).
Para editar una cuota, debes tener el permiso serviceusage.quotas.update
,
que se incluye de forma predeterminada en los roles de propietario y editor.
Sigue estos pasos para editar tu cuota o solicitar un aumento:
Sigue las instrucciones de la subsección anterior para ver las cuotas de cada API.
Selecciona la casilla de verificación a la izquierda de cada cuota que te interese.
Al final de la fila de la cuota, haz clic en el menú de tres puntos y, luego, selecciona Editar cuota.
En el formulario Cambios de la cuota, haz lo siguiente:
Ingresa la cuota aumentada en el campo Valor nuevo.
Esta cuota se aplica a nivel del proyecto y se comparte entre todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.
Completa los campos adicionales del formulario y, luego, haz clic en LISTO.
Haz clic en Enviar solicitud.