Limity i ceny

Na tej stronie opisujemy limity i strukturę cen za interfejs Gemini API Vertex AI.

Limity według regionu i modelu

Limit żądań na minutę (RPM) dotyczy modelu podstawowego i wszystkich wersji, identyfikatorów i dostrojonych wersji danego modelu. Oto przykłady:

  • Prośba do gemini-1.0-pro i gemini-1.0-pro-001 została wysłana liczone jako 2 żądania w ramach limitu RPM modelu podstawowego, gemini-1.0 pro

  • Żądanie do gemini-1.0-pro-001 oraz żądanie do dostrojonego modelu, który na podstawie gemini-1.0-pro-001 są liczone jako 2 żądania w ramach limitu RPM modelu podstawowego, gemini-1.0-pro.

Limity te są stosowane na poziomie projektu i są wspólne dla wszystkich aplikacji i adresów IP, które korzystają z tego projektu Firebase. Ponadto limity dotyczy dowolnego wywołania interfejsu Gemini API, niezależnie od tego, czy używa Pakiety SDK Vertex AI dla Firebase, pakiety SDK serwera (w tym Gemini w Firebase), wywołania REST lub Vertex AI Studio.

Znajdź limity dla każdego modelu dla każdego regionu znajdziesz w dokumentacji Google Cloud.

Poproś o zwiększenie limitu

Jeśli chcesz zwiększyć dowolny limit w Vertex AI, możesz użyć Google Cloud, aby poprosić o zwiększenie limitu. Aby dowiedzieć się więcej o limitach, Więcej informacji: Praca z limitami.



Ceny

Użycie interfejsu Gemini API z Vertex AI wymaga, aby Twój projekt Firebase użyj Abonament Blaze z płatnością według wykorzystania

Znajdź ceny dla każdego modelu znajdziesz w dokumentacji Google Cloud.