מעקב אחר העלויות, השימוש ומדדים אחרים של Gemini API

מעקב אחר העלויות, השימוש ומדדים אחרים של Gemini API הוא חלק חשוב מהפעלת אפליקציה בסביבת ייצור. חשוב לדעת איך נראים דפוסי השימוש הרגילים באפליקציה שלכם ולוודא שאתם לא חורגים מהסף שחשוב לכם.

מעקב אחרי העלויות

בלוח הבקרה Usage and Billing במסוף Firebase אפשר לראות את העלויות של הקריאה ל-Vertex AI Gemini API בפרויקט.

העלויות שמוצגות בלוח הבקרה לא בהכרח ספציפיות לשיחות באמצעות ערכות ה-SDK של הלקוח Vertex AI in Firebase. העלויות המוצגות משויכות לכל קריאה ל-Vertex AI Gemini API, בין אם באמצעות ערכות ה-SDK של הלקוח Vertex AI in Firebase, ערכות ה-SDK של השרת Vertex AI, Firebase Genkit, ה-Firebase Extensions של Gemini API, קריאות REST, Vertex AI Studio או לקוחות API אחרים.

אפשר גם לקבל אומדן של גודל האסימון והתווים לחיוב של הבקשות באמצעות Count Tokens API. מידע נוסף על מגבלות האסימונים לכל מודל ותמחור לכל מודל

הגדרת התראות

כדי להימנע מחיובים לא צפויים, חשוב להגדיר התראות לגבי תקציבים.

חשוב לזכור שהתראות תקציב הן לא מכסות תקציב. התראה תשלח לכם הודעות כשמתקרבים לסף שהוגדר או עברתם אותו, כדי שתוכלו לבצע פעולות באפליקציה או בפרויקט.

מעקב אחר שימוש ומדדים אחרים

אפשר לראות את המדדים של הפרויקט לכל ממשק API, כמו השימוש בו, במסוף Google Cloud.

  1. במסוף Google Cloud, נכנסים לכל דף API: Vertex AI API ו-Vertex AI in Firebase API.

    • דף ה-API של Vertex AI: זהו השימוש שמשויך לכל קריאה ל-Vertex AI Gemini API, בין שבאמצעות ערכות ה-SDK של הלקוח Vertex AI in Firebase, בין שבאמצעות ערכות ה-SDK של השרת Vertex AI, בין שבאמצעות Firebase Genkit, בין שבאמצעות Firebase Extensions ל-Gemini API, בין שבאמצעות קריאות ל-REST, בין שבאמצעות Vertex AI Studio וכו'.

    • דף ה-API של Vertex AI in Firebase: זהו השימוש הספציפי בקריאות שמגיעות מ-SDK של Vertex AI in Firebase.

  2. לוחצים על ניהול.

  3. לוחצים על הכרטיסייה Metrics.

  4. בתפריטים הנפתחים אפשר לראות את המדדים הרלוונטיים, כמו תנועה לפי קוד תגובה, שגיאות לפי שיטת API, זמן אחזור כולל וזמן אחזור לפי שיטת API.