На этой странице описаны квоты и структура цен на Gemini API от Vertex AI .
Квоты по регионам и моделям
Квота запросов в минуту (RPM) применяется к базовой модели и всем версиям, идентификаторам и настроенным версиям этой модели. Вот несколько примеров:
Запрос к
gemini-1.0-pro
и запрос кgemini-1.0-pro-001
учитываются как два запроса в отношении квоты RPM базовой моделиgemini-1.0 pro
.Запрос к
gemini-1.0-pro-001
и запрос к настроенной модели , основанной наgemini-1.0-pro-001
учитываются как два запроса к квоте RPM базовой моделиgemini-1.0-pro
.
Эти квоты применяются на уровне проекта и распространяются на все приложения и IP-адреса, которые используют этот проект Firebase. Кроме того, квоты применяются к любому вызову Gemini API , будь то использование Vertex AI in Firebase SDK, серверных SDK (в том числе через Gemini Firebase Extensions ), вызовов REST или Vertex AI Studio .
Найдите квоты для каждой модели для каждого региона в документации Google Cloud .
Запросить увеличение квоты
Если вы хотите увеличить какую-либо квоту для Vertex AI , вы можете использовать консоль Google Cloud чтобы запросить увеличение квоты. Дополнительные сведения о квотах см. в разделе Работа с квотами .
Обратите внимание, что обе модели Gemini 1.5 (только версия -002
) поддерживают динамическую общую квоту , что может помочь избежать необходимости запрашивать увеличение квоты.
Цены
Для использования Gemini API от Vertex AI необходимо, чтобы в вашем проекте Firebase использовался тарифный план Blaze с оплатой по мере использования .
Цены на каждую модель можно найти в документации Google Cloud .