Квоты и цены

На этой странице описаны квоты и структура цен на Gemini API от Vertex AI.

Квоты по регионам и моделям

Квота запросов в минуту (RPM) применяется к базовой модели и всем версиям, идентификаторам и настроенным версиям этой модели. Вот некоторые примеры:

  • Запрос к gemini-1.0-pro и запрос к gemini-1.0-pro-001 учитываются как два запроса к квоте RPM базовой модели gemini-1.0 pro .

  • Запрос к gemini-1.0-pro-001 и запрос к настроенной модели , основанной на gemini-1.0-pro-001 учитываются как два запроса к квоте RPM базовой модели gemini-1.0-pro .

Эти квоты применяются на уровне проекта и распространяются на все приложения и IP-адреса, которые используют этот проект Firebase. Кроме того, квоты применяются к любому вызову Gemini API, будь то использование Vertex AI для Firebase SDK, серверных SDK (в том числе через расширения Gemini Firebase), вызовов REST или Vertex AI Studio.

Найдите квоты для каждой модели для каждого региона в документации Google Cloud.

Запросить увеличение квоты

Если вы хотите увеличить какую-либо квоту для Vertex AI, вы можете использовать консоль Google Cloud, чтобы запросить увеличение квоты. Дополнительные сведения о квотах см. в разделе Работа с квотами .



Цены

Для использования API Gemini от Vertex AI необходимо, чтобы в вашем проекте Firebase использовался тарифный план Blaze с оплатой по мере использования .

Цены на каждую модель можно найти в документации Google Cloud.