Квоты и цены

На этой странице описаны квоты и структура цен на Gemini API от Vertex AI .

Квоты по регионам и моделям

Квота запросов в минуту (RPM) применяется к базовой модели и всем версиям, идентификаторам и настроенным версиям этой модели. Вот несколько примеров:

  • Запрос к gemini-1.0-pro и запрос к gemini-1.0-pro-001 учитываются как два запроса в отношении квоты RPM базовой модели gemini-1.0 pro .

  • Запрос к gemini-1.0-pro-001 и запрос к настроенной модели , основанной на gemini-1.0-pro-001 учитываются как два запроса к квоте RPM базовой модели gemini-1.0-pro .

Эти квоты применяются на уровне проекта и распространяются на все приложения и IP-адреса, которые используют этот проект Firebase. Кроме того, квоты применяются к любому вызову Gemini API , будь то использование Vertex AI in Firebase SDK, серверных SDK (в том числе через Gemini Firebase Extensions ), вызовов REST или Vertex AI Studio .

Найдите квоты для каждой модели для каждого региона в документации Google Cloud .

Запросить увеличение квоты

Если вы хотите увеличить какую-либо квоту для Vertex AI , вы можете использовать консоль Google Cloud чтобы запросить увеличение квоты. Дополнительные сведения о квотах см. в разделе Работа с квотами .

Обратите внимание, что обе модели Gemini 1.5 (только версия -002 ) поддерживают динамическую общую квоту , что может помочь избежать необходимости запрашивать увеличение квоты.



Цены

Для использования Gemini API от Vertex AI необходимо, чтобы в вашем проекте Firebase использовался тарифный план Blaze с оплатой по мере использования .

Цены на каждую модель можно найти в документации Google Cloud .