Cotas e preços

Nesta página, descrevemos as cotas e a estrutura de preços da API Gemini da Vertex AI.

Cotas por região e modelo

A cota de solicitações por minuto (RPM) se aplica a um modelo base e a todas as versões, identificadores e versões ajustadas desse modelo. Estes são alguns exemplos:

  • Uma solicitação para gemini-1.0-pro e uma para gemini-1.0-pro-001 são contabilizadas como duas solicitações na cota de RPM do modelo base, gemini-1.0 pro.

  • Uma solicitação para gemini-1.0-pro-001 e outra para um modelo ajustado baseado em gemini-1.0-pro-001 são contabilizadas como duas solicitações na cota de RPM do modelo base, gemini-1.0-pro.

Essas cotas se aplicam no nível do projeto e são compartilhadas por todos os aplicativos e endereços IP que usam esse projeto do Firebase. Além disso, as cotas se aplicam a qualquer chamada à API Gemini, seja usando os SDKs da Vertex AI para Firebase, os SDKs do servidor (inclusive pelas Extensões do Firebase do Gemini), chamadas REST ou o Vertex AI Studio.

Encontre as cotas de cada modelo para cada região na documentação do Google Cloud.

Solicitar aumento de cota

Se você quiser aumentar qualquer uma das suas cotas da Vertex AI, use o Console do Google Cloud para solicitar um aumento de cota. Para saber mais sobre cotas, consulte Trabalhar com cotas.



Preços

O uso da API Gemini da Vertex AI exige que seu projeto do Firebase use o plano de preços de pagamento por utilização Blaze.

Encontre os preços de cada modelo na documentação do Google Cloud.