Cuotas y precios

En esta página, se describen las cuotas y la estructura de precios de la API de Gemini de Vertex AI.

Cuotas por región y modelo

La cuota de solicitudes por minuto (RPM) se aplica a un modelo base y a todas las versiones, identificadores y versiones ajustadas de ese modelo. Estos son algunos ejemplos:

  • Una solicitud a gemini-1.0-pro y una a gemini-1.0-pro-001 se cuentan como dos solicitudes respecto de la cuota de RPM del modelo base, gemini-1.0 pro.

  • Una solicitud a gemini-1.0-pro-001 y una solicitud a un modelo ajustado que se basa en gemini-1.0-pro-001 se cuentan como dos solicitudes en la cuota de RPM del modelo base, gemini-1.0-pro.

Estas cuotas se aplican a nivel de proyecto y se comparten entre todas las aplicaciones y direcciones IP que usan el proyecto de Firebase. Además, las cuotas se aplican a cualquier llamada a la API de Gemini, ya sea que se use los SDK de Vertex AI para Firebase, los SDK de servidor (incluso a través de las Extensiones de Firebase de Gemini), las llamadas de REST o Vertex AI Studio.

Consulta las cuotas de cada modelo para cada región en la documentación de Google Cloud.

Solicitar un aumento de cuota

Si quieres aumentar cualquiera de tus cuotas de Vertex AI, puedes usar la consola de Google Cloud para solicitar un aumento de cuota. Para obtener más información sobre las cuotas, consulta Trabaja con cuotas.



Precios

Para usar la API de Gemini desde Vertex AI, el proyecto de Firebase debe usar el plan de precios Blaze (prepago).

Consulta el precio de cada modelo en la documentación de Google Cloud.