|
Kliknij swojego dostawcę Gemini API, aby wyświetlić na tej stronie treści i kod dotyczące konkretnego dostawcy. |
Limity liczby żądań (nazywane też limitami) określają, ile żądań możesz wysłać do Gemini API w danym przedziale czasu. Pomagają one zapewnić sprawiedliwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.
Gdy używasz Firebase AI Logic do wysyłania żądań do modeli Gemini i Imagen, limity liczby żądań w Twoim projekcie zależą od wybranego dostawcy „Gemini API”. Firebase AI Logic umożliwia też ustawianie limitów liczby żądań "na użytkownika".
Wyświetlanie limitów liczby żądań w interfejsie Gemini Developer API
Jeśli przekroczysz limit lub pojemność modelu, do którego uzyskujesz dostęp, zostanie wyczerpana, otrzymasz komunikat o błędzie 429.
Jak działają limity liczby żądań (limity)
Limity liczby żądań (limity) są mierzone w 4 wymiarach:
- Żądania na minutę (RPM)
- Żądania dziennie (RPD)
- Tokeny na minutę (TPM)
- Tokeny dziennie (TPD)
Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd 429. Jeśli na przykład limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.
Limity liczby żądań są stosowane na poziomie projektu i dotyczą wszystkich aplikacji oraz adresów IP, które używają tego projektu w Firebase.
Limity różnią się w zależności od używanego modelu, a niektóre limity dotyczą tylko określonych modeli. Na przykład obrazy na minutę (IPM) są tylko obliczane w przypadku modeli, które mogą generować obrazy (Imagen), ale są podobne do TPM.
Limity liczby żądań są bardziej restrykcyjne w przypadku modeli eksperymentalnych i w wersji zapoznawczej.
Prośba o zwiększenie limitu liczby żądań
Jeśli korzystasz z „płatnego pakietu” dla Gemini Developer API, możesz poprosić o zwiększenie limitu liczby żądań.
Ustawianie limitów liczby żądań „na użytkownika”
Aby korzystać z Firebase AI Logic, Twój projekt musi mieć włączonego wybranego Gemini API dostawcę, ale musisz też włączyć Firebase AI Logic API, który działa jako brama między naszymi pakietami SDK klienta a Twoim Gemini API dostawcą. Ten interfejs API jest włączany, gdy po raz pierwszy skonfigurujesz Firebase AI Logic w projekcie w Firebase.
Możesz użyć limitu liczby żądań (limitu) interfejsu Firebase AI Logic API jako limitu liczby żądań „na użytkownika” w aplikacji, szczególnie w przypadku funkcji AI, które korzystają z Firebase AI Logic. Ustaw ten limit tak, aby rozsądnie uwzględnić jednego użytkownika uzyskującego dostęp do funkcji AI, a jednocześnie zapewnić, że żaden użytkownik nie przekroczy limitów dostawcy Gemini API (który ma być współdzielony przez wszystkich użytkowników).
Szczegóły limitu liczby żądań „na użytkownika”
Oto kilka ważnych informacji o Firebase AI Logic API limitach liczby żądań (limitach) – w szczególności o żądaniach na minutę (RPM):
Jest on oparty na „żądaniach generowania treści” na użytkownika, region i minutę, a nie na modelu.
Jest to limit liczby żądań stosowany do wszystkich użytkowników. Obecnie nie można ustawić limitu liczby żądań dla konkretnego użytkownika ani grupy użytkowników*.
Jest on stosowany na poziomie projektu i dotyczy wszystkich aplikacji oraz adresów IP, które używają tego projektu w Firebase.
Dotyczy każdego wywołania, które pochodzi z dowolnego Firebase AI Logic SDK.
Domyślny limit liczby żądań to 100 RPM na użytkownika.
Pamiętaj, że nadal musisz uwzględniać limity dostawcy Gemini API (patrz wyżej), które mają pierwszeństwo przed interfejsem Firebase AI Logic API.
* Jeśli używasz Vertex AI Gemini API i Twoja aplikacja kieruje użytkowników do różnych regionów (np. za pomocą Firebase Remote Config), możesz ustawić konkretny limit liczby żądań dla użytkowników w danym regionie.
Dostosowywanie limitu liczby żądań „na użytkownika”
Aby dostosować limit liczby żądań (limit), musisz mieć uprawnienie serviceusage.quotas.update, które jest domyślnie uwzględnione w roli właściciela i edytującego.
Aby edytować limit liczby żądań (limit) lub poprosić o jego zwiększenie:
W konsoli Google Cloud otwórz stronę interfejsu Firebase AI Logic API.
Kliknij Zarządzaj.
Niżej na stronie kliknij kartę Limity przydziału i limity systemu.
Filtruj tabelę, aby wyświetlać interesujące Cię limity, np. możliwości (żądania generowania treści) i region.
Aby na przykład wyświetlić limity na użytkownika dotyczące żądań generowania treści w dowolnym obsługiwanym regionie Azji, filtr będzie wyglądać podobnie do tego:
Generate content requests+Dimension:region:asiaZaznacz pole wyboru po lewej stronie każdego interesującego Cię limitu.
Na końcu wiersza limitu kliknij , a potem wybierz Edytuj limit.
W formularzu Zmiany limitów wykonaj te czynności:
W polu Nowa wartość wpisz zwiększony limit.
Ten limit jest stosowany na poziomie projektu i jest współdzielony przez wszystkie aplikacje oraz adresy IP, które używają tego projektu w Firebase.
Wypełnij wszelkie dodatkowe pola w formularzu i kliknij Gotowe.
Kliknij Prześlij prośbę.