הסבר על המכסות וניהול שלהן

כדי להשתמש ב-Vertex AI in Firebase נדרשים שני ממשקי API שונים (לכל אחד מהם מכסה משלו): Vertex AI API ו-Vertex AI in Firebase API.

לכל אחד מה-API האלה יש מכסה שנמדדת לפי מספר בקשות לדקה (RPM) – במיוחד בקשות ליצירת תוכן (גם בסטרימינג וגם ללא סטרימינג). ל-API Vertex AI יש גם מכסה לאסימוני קלט לדקה.

בדף הזה נסביר את הנושאים הבאים:

מידע כללי על מכסות זמין במסמכי התיעוד של Google Cloud.

הסבר על המכסות לכל ממשק API

המכסות של כל ממשק API נמדדות באופן שונה במקצת, כך שאפשר להשתמש בהן למטרות שונות.

הסבר על המכסות של Vertex AI API

המכסות של ה-API‏ Vertex AI מבוססות על 'בקשות ליצירת תוכן' לכל מודל, לכל אזור לכל דקה.

ריכזנו כאן כמה פרטים חשובים לגבי המכסות האלה (במיוחד בקשות לדקה ואסימוני קלט לדקה):

  • הן חלות ברמת הפרויקט ומשותפות בין כל האפליקציות וכתובות ה-IP שמשתמשות באותו פרויקט ב-Firebase.

  • הן חלות על כל קריאה ל-Vertex AI Gemini API, בין שבאמצעות ערכות ה-SDK של הלקוח Vertex AI in Firebase, בין שבאמצעות ערכות ה-SDK של השרת Vertex AI, בין שבאמצעות Firebase Genkit, בין שבאמצעות Gemini Firebase Extensions, בין שבאמצעות קריאות REST, בין שבאמצעות Vertex AI Studio ובין שבאמצעות לקוחות API אחרים.

  • הן חלות על מודל בסיס ועל כל הגרסאות, המזהים והגרסאות המותאמות של המודל הזה. הנה כמה דוגמאות:

    • בקשה ל-gemini-1.0-pro ובקשה ל-gemini-1.0-pro-001 נספרות כשתי בקשות במסגרת המכסה של ההכנסה לאלף חשיפות בדגם הבסיסי, gemini-1.0 pro.

    • בקשה ל-gemini-1.0-pro-001 ובקשה למודל מכוונן שמבוסס על gemini-1.0-pro-001 נספרות כשתי בקשות במכסת ה-RPM של מודל הבסיס, gemini-1.0-pro.

  • המכסות שמוגדרות כברירת מחדל לכל מודל לכל אזור מפורטות במסמכי התיעוד של Google Cloud.

אפשר להתייחס למכסות של ה-API הזה כמכסות'סה "כ' לכל המשתמשים שלכם (שמשתמשים בתכונות ה-AI באפליקציה שלכם שמסתמכות על מודל ספציפי באזור ספציפי).

המכסות האלה צריכות להיות גבוהות מספיק כדי להכיל באופן סביר את המספר הכולל של משתמשי הקצה באזור ספציפי שעשויים לגשת לתכונות ה-AI שלכם שמבוססות על מודל ספציפי. מכיוון שמדובר במכסות לדקה, סביר להניח שכל המשתמשים באזור מסוים לא ישתמשו באותה קבוצת תכונות בו-זמנית ויוציאו את המכסות האלה. עם זאת, כל אפליקציה שונה, ולכן צריך לשנות את המכסות בהתאם.

הסבר על המכסה של Vertex AI in Firebase API

המכסה של ה-API‏ Vertex AI in Firebase מבוססת על 'יצירת בקשות ליצירת תוכן', לכל משתמש, לכל אזור לכל דקה.

ריכזנו כאן כמה פרטים חשובים לגבי המכסה הזו (במיוחד, מספר הבקשות לדקה):

  • היא חלה ברמת הפרויקט וחלה על כל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.

  • הוא חל על כל קריאה שעוברת באופן ספציפי דרך כל SDK של Vertex AI in Firebase.

  • מכסת ברירת המחדל היא 100 בקשות לשעה לכל משתמש.
    לתשומת ליבכם: עדיין צריך להביא בחשבון את המגבלות של המכסות ל-Vertex AI API, במיוחד אם הן נמוכות מ-100 RPM.

אפשר להתייחס למכסת ה-API הזו כמכסה 'לכל משתמש' של תכונות ה-AI שמסתמכות על Vertex AI in Firebase.

המכסה הזו צריכה להיות גבוהה מספיק כדי לאפשר למשתמש יחיד לגשת לתכונות ה-AI שמסתמכות על Vertex AI in Firebase. מאחר ש-API הזה משמש כשער ל-Vertex AI API, תוכלו להשתמש במכסת ה-Vertex AI in Firebase API כדי לוודא שאף משתמש יחיד לא יגמר את המכסה של ה-Vertex AI API (שמיועדת לשיתוף בין כל המשתמשים).

הצגת המכסות לכל ממשק API

אפשר לראות את המכסות של כל ממשק API במסוף Google Cloud.

  1. במסוף Google Cloud, עוברים לדף של ה-API הרצוי: Vertex AI API או Vertex AI in Firebase API.

  2. לוחצים על ניהול.

  3. בהמשך הדף, לוחצים על הכרטיסייה Quotas & System Limits.

  4. מסננים את הטבלה כדי להציג את המכסות הרצויות.

    חשוב לזכור: כדי ליצור מסנן Dimension, צריך להשתמש בכלי הסינון ולא רק להעתיק ולהדביק את הערכים בדוגמאות הבאות.

    • ב-API Vertex AI: מציינים את היכולת (בקשות ליצירת תוכן), שם המודל ואת האזור.

      לדוגמה, כדי להציג את המכסות ליצירת בקשות ליצירת תוכן באמצעות Gemini 1.5 Flash באזור כלשהו באיחוד האירופי, המסנן ייראה כך:
      Generate content requests + Dimension:base_model:gemini-1.5-flash + Dimension:region:eu

    • ב-API Vertex AI in Firebase: מציינים את היכולת (בקשות ליצירת תוכן) ואת האזור.

      לדוגמה, כדי להציג את המכסות לכל משתמש ליצירת בקשות ליצירת תוכן באזורים הנתמכים באסיה, המסנן ייראה כך:
      Generate content requests + Dimension:region:asia

      חשוב לזכור שהמכסות של ה-API Vertex AI in Firebase לא מבוססות על מודל ספציפי. בנוסף, שורת המכסה (default) לא חלה על Vertex AI in Firebase.

עריכת המכסה או בקשה להגדלת המכסה

לפני שמעבירים את השירות לסביבת הייצור, או אם מופיעות שגיאות מסוג 429 על חרגה מהמכסה, יכול להיות שתצטרכו לערוך את המכסה או לבקש הגדלה שלה. חשוב לשנות את המכסה של כל API בהתאם (הסבר על המכסות של כל API למעלה בדף הזה).

כדי לערוך מכסה, צריכה להיות לכם ההרשאה serviceusage.quotas.update, שכלולה כברירת מחדל בתפקידים 'בעלים' ו'עריכה'.

כך עורכים את המכסה או מבקשים להגדיל אותה:

  1. פועלים לפי ההוראות בקטע הקודם כדי להציג את המכסות של כל ממשק API.

  2. מסמנים את התיבה שמשמאל לכל מכסה שרוצים לשנות.

  3. בסוף השורה של המכסה, לוחצים על התפריט של שלוש הנקודות ובוחרים באפשרות Edit quota.

  4. בטופס Quota changes, מבצעים את הפעולות הבאות:

    1. מזינים את המכסה המוגדלת בשדה New value.

      המכסה הזו חלה ברמת הפרויקט ומופעלת בכל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.

    2. ממלאים את שאר השדות בטופס ולוחצים על Done.

    3. לוחצים על שליחת בקשה.