Kosten, Nutzung und andere Messwerte der Gemini API im Blick behalten

Das Überwachen Ihrer Kosten, der Nutzung und anderer Messwerte der Gemini API ist ein wichtiger Teil der Ausführung einer Produktions-App. Es ist wichtig zu wissen, wie normale Nutzungsmuster für Ihre App aussehen, und dafür zu sorgen, dass Sie die für Sie wichtigen Grenzwerte einhalten.

Kosten überwachen

Im Dashboard Nutzung und Abrechnung der Firebase Console können Sie die Kosten für das Aufrufen der Vertex AI Gemini API für Ihr Projekt einsehen.

Die im Dashboard angezeigten Kosten beziehen sich nicht unbedingt auf Aufrufe über die Vertex AI in Firebase-Client-SDKs. Die angezeigten Kosten sind mit allen Aufrufen der Vertex AI Gemini API verknüpft, unabhängig davon, ob die Vertex AI in Firebase Client-SDKs, die Vertex AI Server-SDKs, Firebase Genkit, die Firebase Extensions für die Gemini API, REST-Aufrufe, Vertex AI Studio oder andere API-Clients verwendet werden.

Mit der Count Tokens API können Sie auch eine Schätzung der Tokengröße und der abrechenbaren Zeichen Ihrer Anfragen abrufen. Weitere Informationen zu Tokenlimits pro Modell und Preisen pro Modell

Benachrichtigung einrichten

Um unerwartete Rechnungen zu vermeiden, sollten Sie Budgetbenachrichtigungen einrichten.

Budgetbenachrichtigungen sind keine Budgetlimits. Sie erhalten eine Benachrichtigung, wenn Sie den konfigurierten Grenzwert erreichen oder überschreiten, damit Sie Maßnahmen in Ihrer App oder Ihrem Projekt ergreifen können.

Nutzung und andere Messwerte im Blick behalten

In der Google Cloud Console können Sie die Messwerte Ihres Projekts für jede API aufrufen, z. B. die Nutzung.

  1. Rufen Sie in der Google Cloud Console die Seiten der beiden APIs auf: Vertex AI API und Vertex AI in Firebase API.

    • Vertex AI API-Seite: Dieser Wert ist mit jeder Aufruf der Vertex AI Gemini API verknüpft, unabhängig davon, ob die Vertex AI in Firebase Client-SDKs, die Vertex AI Server-SDKs, Firebase Genkit, die Firebase Extensions für die Gemini API, REST-Aufrufe oder Vertex AI Studio verwendet werden.

    • Vertex AI in Firebase API-Seite: Dieser Wert gilt speziell für Aufrufe, die von den Vertex AI in Firebase SDKs stammen.

  2. Klicken Sie auf Verwalten.

  3. Klicken Sie auf den Tab Messwerte.

  4. Über die Drop-down-Menüs können Sie die gewünschten Messwerte aufrufen, z. B. Traffic nach Antwortcode, Fehler nach API-Methode, Gesamtlatenz und Latenz nach API-Methode.