|
Klicken Sie auf Ihren Gemini API Anbieter, um anbieterspezifische Inhalte und Code auf dieser Seite aufzurufen. |
Ratenlimits (allgemein als Kontingente bezeichnet) regeln die Anzahl der Anfragen, die Sie an die Gemini API innerhalb eines bestimmten Zeitraums senden können. Diese Limits tragen zu einer fairen Nutzung bei, schützen vor Missbrauch und helfen, die Systemleistung für alle Nutzer aufrechtzuerhalten.
Wenn Sie Firebase AI Logic verwenden, um Anfragen an Gemini und Imagen Modelle zu senden, hängen die Ratenlimits Ihres Projekts vom ausgewählten "Gemini API" Anbieter ab. Firebase AI Logic bietet auch die Möglichkeit, Ratenlimits pro Nutzer festzulegen.
Ratenlimits für die Gemini Developer API ansehen
Wenn Sie Ihr Kontingent überschreiten oder die Kapazität für das Modell, auf das Sie zugreifen, erschöpft ist, erhalten Sie die Fehlermeldung 429.
So funktionieren Ratenlimits (Kontingente)
Ratenlimits (Kontingente) werden anhand von vier Dimensionen gemessen:
- Anfragen pro Minute (Requests Per Minute, RPM)
- Anfragen pro Tag (Requests Per Day, RPD)
- Tokens pro Minute (Tokens Per Minute, TPM)
- Tokens pro Tag (Tokens Per Day, TPD)
Ihre Nutzung wird mit jedem Limit verglichen. Wenn Sie eines der Limits überschreiten, wird der Fehler 429 „Kontingent überschritten“ ausgelöst. Wenn Ihr RPM-Limit beispielsweise 20 beträgt, führt das Senden von 21 Anfragen innerhalb einer Minute zu einem Fehler, auch wenn Sie Ihr TPM- oder andere Limits nicht überschritten haben.
Ratenlimits werden auf Projektebene angewendet und gelten für alle Anwendungen und IP-Adressen, die dieses Firebase-Projekt verwenden.
Die Limits variieren je nach verwendetem Modell. Einige Limits gelten nur für bestimmte Modelle. So wird beispielsweise „Bilder pro Minute“ (Images Per Minute, IPM) nur für Modelle berechnet, die Bilder generieren können (Imagen). Das Konzept ist jedoch ähnlich wie bei TPM.
Die Ratenlimits für experimentelle Modelle und Modelle in der Vorschau sind strenger.
Erhöhung des Ratenlimits beantragen
Wenn Sie ein kostenpflichtiges Abo für die Gemini Developer API haben, können Sie eine Erhöhung des Ratenlimits beantragen.
Ratenlimits pro Nutzer festlegen
Wenn Sie Firebase AI Logic verwenden möchten, muss der von Ihnen ausgewählte Gemini API Anbieter für Ihr Projekt aktiviert sein. Außerdem muss die Firebase AI Logic API aktiviert sein, die als Gateway zwischen unseren Client-SDKs und Ihrem Gemini API Anbieter fungiert. Diese API wird für Sie aktiviert, wenn Sie Firebase AI Logic zum ersten Mal in Ihrem Firebase-Projekt einrichten.
Sie können das Ratenlimit (Kontingent) der Firebase AI Logic API als Ratenlimit pro Nutzer für Ihre App verwenden, insbesondere für die KI-Funktionen, die auf Firebase AI Logic basieren. Sie sollten dieses Limit so festlegen, dass ein einzelner Nutzer angemessen auf Ihre KI-Funktionen zugreifen kann, und gleichzeitig dafür sorgen, dass kein einzelner Nutzer die Limits Ihres Gemini API Anbieters überschreitet (die für alle Ihre Nutzer gelten).
Details zum Ratenlimit pro Nutzer
Hier sind einige wichtige Details zu den Firebase AI Logic API Ratenlimits (Kontingenten), insbesondere zu Anfragen pro Minute (RPM):
Es basiert auf „Anfragen zum Generieren von Inhalten“ pro Nutzer, Region und Minute und nicht auf dem Modell.
Es ist das Ratenlimit, das für alle Ihre Nutzer gilt. Derzeit ist es nicht möglich, das Ratenlimit für einen bestimmten Nutzer oder eine bestimmte Nutzergruppe festzulegen*.
Es gilt auf Projektebene und für alle Anwendungen und IP-Adressen, die dieses Firebase-Projekt verwenden.
Es gilt für alle Aufrufe, die speziell von einem Firebase AI Logic SDK stammen.
Das Standardratenlimit beträgt 100 RPM pro Nutzer.
Beachten Sie, dass Sie weiterhin die Limits für Ihren Gemini API Anbieter berücksichtigen müssen (siehe oben), die Vorrang vor der Firebase AI Logic API haben.
* Wenn Sie die Vertex AI Gemini API verwenden und Ihre App Nutzer an verschiedene Regionen weiterleitet (z. B. mit Firebase Remote Config), können Sie ein bestimmtes Ratenlimit für Nutzer in einer bestimmten Region festlegen.
Ratenlimit pro Nutzer anpassen
Wenn Sie ein Ratenlimit (Kontingent) anpassen möchten, benötigen Sie die Berechtigung serviceusage.quotas.update, die standardmäßig in der Rolle „Inhaber“ und „Editor“ enthalten ist.
So bearbeiten Sie Ihr Ratenlimit (Kontingent) oder beantragen eine Erhöhung:
Rufen Sie in der Google Cloud Console die Seite für die Firebase AI Logic API auf.
Klicken Sie auf Verwalten.
Klicken Sie weiter unten auf der Seite auf den Tab Kontingente und Systemlimits.
Filtern Sie die Tabelle, um die gewünschten Kontingente anzuzeigen, z. B. die Funktion (Anfragen zum Generieren von Inhalten) und die Region.
Wenn Sie beispielsweise die Kontingente pro Nutzer für Anfragen zum Generieren von Inhalten in einer der unterstützten asiatischen Regionen aufrufen möchten, sieht Ihr Filter so ähnlich aus: dieser:
Generate content requests+Dimension:region:asiaKlicken Sie das Kästchen links neben jedem gewünschten Kontingent an.
Klicken Sie am Ende der Kontingentzeile auf , und wählen Sie Kontingent bearbeiten aus.
Führen Sie im Formular Kontingentänderungen die folgenden Schritte aus:
Geben Sie das erhöhte Kontingent in das Feld Neuer Wert ein.
Dieses Kontingent gilt auf Projektebene und wird für alle Anwendungen und IP-Adressen verwendet, die dieses Firebase-Projekt verwenden.
Füllen Sie die zusätzlichen Felder im Formular aus und klicken Sie dann auf Fertig.
Klicken Sie auf Anfrage senden.