Surveiller vos coûts, votre utilisation et d'autres métriques de l'API Gemini

Surveiller vos coûts, votre utilisation et d'autres métriques de l'Gemini API est une partie importante de l'exécution d'une application de production. Il est important de savoir à quoi ressemblent les modèles d'utilisation normaux pour votre application et de vous assurer de respecter les seuils qui vous intéressent.

Surveiller les coûts

Dans le tableau de bord Utilisation et facturation de la console Firebase, vous pouvez afficher les coûts de votre projet liés à l'appel de Vertex AI Gemini API.

Les coûts affichés sur le tableau de bord ne sont pas nécessairement spécifiques aux appels via les SDK client Vertex AI in Firebase. Les coûts affichés sont associés à tout appel à Vertex AI Gemini API, qu'il utilise les SDK client Vertex AI in Firebase, les SDK serveur Vertex AI, Firebase Genkit, le Firebase Extensions pour le Gemini API, les appels REST, Vertex AI Studio ou d'autres clients d'API.

Vous pouvez également obtenir une estimation de la taille du jeton et des caractères facturables de vos requêtes à l'aide de l'API Count Tokens. En savoir plus sur les limites de jetons par modèle et les tarifs par modèle

Configurer les alertes

Pour éviter les factures inattendues, veillez à configurer des alertes budgétaires.

Notez que les alertes de budget ne sont pas des plafonds de budget. Une alerte vous envoie des communications lorsque vous approchez ou dépassez le seuil configuré, afin que vous puissiez prendre des mesures dans votre application ou votre projet.

Surveiller l'utilisation et d'autres métriques

Vous pouvez consulter les métriques de votre projet pour chaque API, comme son utilisation, dans la console Google Cloud.

  1. Dans la console Google Cloud, accédez à la page de chaque API : Vertex AI API et Vertex AI in Firebase API.

    • Page de l'API Vertex AI: il s'agit de l'utilisation associée à tout appel à Vertex AI Gemini API, que ce soit à l'aide des SDK client Vertex AI in Firebase, des SDK serveur Vertex AI, de Firebase Genkit, de Firebase Extensions pour Gemini API, d'appels REST, de Vertex AI Studio, etc.

    • Page de l'API Vertex AI in Firebase: utilisation spécifique des appels provenant des SDK Vertex AI in Firebase.

  2. Cliquez sur Gérer.

  3. Cliquez sur l'onglet Métriques.

  4. Utilisez les menus déroulants pour afficher les métriques qui vous intéressent, comme le trafic par code de réponse, les erreurs par méthode d'API, la latence globale et la latence par méthode d'API.