Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Nesta página, descrevemos as cotas e a estrutura de preços da API Gemini da
Vertex AI.
Cotas por região e modelo
A cota de solicitações por minuto (RPM) se aplica a um modelo base e a todas as versões,
identificadores e versões ajustadas desse modelo. Estes são alguns exemplos:
Uma solicitação para gemini-1.0-pro e uma para gemini-1.0-pro-001 são contabilizadas como duas solicitações na cota de RPM do modelo base, gemini-1.0 pro.
Uma solicitação para gemini-1.0-pro-001 e outra para um modelo ajustado baseado em gemini-1.0-pro-001 são contabilizadas como duas solicitações na cota de RPM do modelo base, gemini-1.0-pro.
Essas cotas se aplicam no nível do projeto e são compartilhadas por todos
os aplicativos e endereços IP que usam esse projeto do Firebase. Além disso, as cotas
se aplicam a qualquer chamada à API Gemini, seja usando os
SDKs da Vertex AI para Firebase, os SDKs do servidor (inclusive pelas
Extensões do Firebase do Gemini), chamadas REST ou o Vertex AI Studio.
Se você quiser aumentar qualquer uma das suas cotas da Vertex AI, use o
Console do Google Cloud para solicitar um aumento de cota. Para saber mais sobre cotas,
consulte Trabalhar com cotas.