Limity i kwoty

Kliknij swojego dostawcę Gemini API, aby wyświetlić na tej stronie treści i kod dotyczące konkretnego dostawcy.


Limity liczby żądań (nazywane też limitami) określają, ile żądań możesz wysłać do Gemini API w danym przedziale czasu. Pomagają one zapewnić sprawiedliwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.

Gdy używasz Firebase AI Logic do wysyłania żądań do modeli Gemini i Imagen, limity liczby żądań w Twoim projekcie zależą od wybranego dostawcy „Gemini API”. Firebase AI Logic umożliwia też ustawianie limitów liczby żądań "na użytkownika".

Wyświetlanie limitów liczby żądań w interfejsie Gemini Developer API

Jeśli przekroczysz limit lub pojemność modelu, do którego uzyskujesz dostęp, zostanie wyczerpana, otrzymasz komunikat o błędzie 429.

Jak działają limity liczby żądań (limity)

Limity liczby żądań (limity) są mierzone w 4 wymiarach:

  • Żądania na minutę (RPM)
  • Żądania dziennie (RPD)
  • Tokeny na minutę (TPM)
  • Tokeny dziennie (TPD)

Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd 429. Jeśli na przykład limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.

Limity liczby żądań są stosowane na poziomie projektu i dotyczą wszystkich aplikacji oraz adresów IP, które używają tego projektu w Firebase.

Limity różnią się w zależności od używanego modelu, a niektóre limity dotyczą tylko określonych modeli. Na przykład obrazy na minutę (IPM) są tylko obliczane w przypadku modeli, które mogą generować obrazy (Imagen), ale są podobne do TPM.

Limity liczby żądań są bardziej restrykcyjne w przypadku modeli eksperymentalnych i w wersji zapoznawczej.

Prośba o zwiększenie limitu liczby żądań

Jeśli korzystasz z „płatnego pakietu” dla Gemini Developer API, możesz poprosić o zwiększenie limitu liczby żądań.

Ustawianie limitów liczby żądań „na użytkownika”

Aby korzystać z Firebase AI Logic, Twój projekt musi mieć włączonego wybranego Gemini API dostawcę, ale musisz też włączyć Firebase AI Logic API, który działa jako brama między naszymi pakietami SDK klienta a Twoim Gemini API dostawcą. Ten interfejs API jest włączany, gdy po raz pierwszy skonfigurujesz Firebase AI Logic w projekcie w Firebase.

Możesz użyć limitu liczby żądań (limitu) interfejsu Firebase AI Logic API jako limitu liczby żądań „na użytkownika” w aplikacji, szczególnie w przypadku funkcji AI, które korzystają z Firebase AI Logic. Ustaw ten limit tak, aby rozsądnie uwzględnić jednego użytkownika uzyskującego dostęp do funkcji AI, a jednocześnie zapewnić, że żaden użytkownik nie przekroczy limitów dostawcy Gemini API (który ma być współdzielony przez wszystkich użytkowników).

Szczegóły limitu liczby żądań „na użytkownika”

Oto kilka ważnych informacji o Firebase AI Logic API limitach liczby żądań (limitach) – w szczególności o żądaniach na minutę (RPM):

  • Jest on oparty na „żądaniach generowania treści” na użytkownika, region i minutę, a nie na modelu.

  • Jest to limit liczby żądań stosowany do wszystkich użytkowników. Obecnie nie można ustawić limitu liczby żądań dla konkretnego użytkownika ani grupy użytkowników*.

  • Jest on stosowany na poziomie projektu i dotyczy wszystkich aplikacji oraz adresów IP, które używają tego projektu w Firebase.

  • Dotyczy każdego wywołania, które pochodzi z dowolnego Firebase AI Logic SDK.

  • Domyślny limit liczby żądań to 100 RPM na użytkownika.
    Pamiętaj, że nadal musisz uwzględniać limity dostawcy Gemini API (patrz wyżej), które mają pierwszeństwo przed interfejsem Firebase AI Logic API.

* Jeśli używasz Vertex AI Gemini API i Twoja aplikacja kieruje użytkowników do różnych regionów (np. za pomocą Firebase Remote Config), możesz ustawić konkretny limit liczby żądań dla użytkowników w danym regionie.

Dostosowywanie limitu liczby żądań „na użytkownika”

Aby dostosować limit liczby żądań (limit), musisz mieć uprawnienie serviceusage.quotas.update, które jest domyślnie uwzględnione w roli właściciela i edytującego.

Aby edytować limit liczby żądań (limit) lub poprosić o jego zwiększenie:

  1. W konsoli Google Cloud otwórz stronę interfejsu Firebase AI Logic API.

  2. Kliknij Zarządzaj.

  3. Niżej na stronie kliknij kartę Limity przydziału i limity systemu.

  4. Filtruj tabelę, aby wyświetlać interesujące Cię limity, np. możliwości (żądania generowania treści) i region.

    Aby na przykład wyświetlić limity na użytkownika dotyczące żądań generowania treści w dowolnym obsługiwanym regionie Azji, filtr będzie wyglądać podobnie do tego: Generate content requests + Dimension:region:asia

  5. Zaznacz pole wyboru po lewej stronie każdego interesującego Cię limitu.

  6. Na końcu wiersza limitu kliknij , a potem wybierz Edytuj limit.

  7. W formularzu Zmiany limitów wykonaj te czynności:

    1. W polu Nowa wartość wpisz zwiększony limit.

      Ten limit jest stosowany na poziomie projektu i jest współdzielony przez wszystkie aplikacje oraz adresy IP, które używają tego projektu w Firebase.

    2. Wypełnij wszelkie dodatkowe pola w formularzu i kliknij Gotowe.

    3. Kliknij Prześlij prośbę.