|
לוחצים על הספק Gemini API כדי לראות בדף הזה תוכן וקוד שספציפיים לספק. |
הגבלות על קצב שליחת בקשות (שנקראות בדרך כלל מכסות) קובעות את מספר הבקשות שאפשר לשלוח אל Gemini API בפרק זמן נתון. המגבלות האלה עוזרות לנו לוודא שיש שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.
כשמשתמשים ב-Firebase AI Logic כדי לשלוח בקשות למודלים של Gemini ושל Imagen, מגבלות הקצב של הפרויקט תלויות בספק Gemini API שבחרתם. Firebase AI Logic מספקת גם דרך להגדיר מגבלות קצב 'לכל משתמש'.
הצגת מגבלות התעריפים של Gemini Developer API
איך פועלות מגבלות הקצב (מכסות)
מגבלות הקצב (מכסות) נמדדות בארבעה מאפיינים:
- בקשות בדקה (RPM)
- בקשות ביום (RPD)
- טוקנים לדקה (TPM)
- טוקנים ביום (TPD)
השימוש שלכם נבדק מול כל מגבלה, וחריגה ממגבלה כלשהי תגרום לשגיאה 429 (חריגה מהמכסה). לדוגמה, אם מגבלת ה-RPM היא 20, שליחת 21 בקשות בתוך דקה תגרום לשגיאה, גם אם לא חרגתם ממגבלת ה-TPM או ממגבלות אחרות.
המגבלות על קצב הבקשות חלות ברמת הפרויקט, על כל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.
המגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מהמגבלות חלות רק על מודלים ספציפיים. לדוגמה, המדד 'תמונות לדקה' (IPM) מחושב רק עבור מודלים שיכולים ליצור תמונות (Imagen), אבל הוא דומה מבחינה רעיונית למדד TPM.
מגבלות הקצב במודלים ניסיוניים ובמודלים בגרסת טרום-השקה (Preview) הן מחמירות יותר.
בקשה להגדלת מגבלת קצב הבקשות
אם אתם משתמשים בGemini Developer API בתוכנית בתשלום, אתם יכולים לבקש להגדיל את קצב יצירת הבקשות שמותר במסגרת המגבלה.
הגדרת מגבלות קצב לכל משתמש
כדי להשתמש ב-Firebase AI Logic, צריך להפעיל בפרויקט את ספק Firebase AI Logic שבחרתם, אבל צריך גם להפעיל את Firebase AI Logic API, שמשמש כשער בין ערכות ה-SDK של הלקוח לבין ספק Firebase AI Logic.Gemini APIGemini API ה-API הזה מופעל בשבילכם כשמגדירים את Firebase AI Logic בפרויקט Firebase.
אתם יכולים להשתמש במכסה של קצב שליחת הבקשות (quota) של Firebase AI Logic API כהגבלה על קצב שליחת הבקשות "לכל משתמש" באפליקציה שלכם, במיוחד עבור תכונות ה-AI שמסתמכות על Firebase AI Logic. מומלץ להגדיר את המגבלה הזו כך שתאפשר למשתמש יחיד לגשת לתכונות ה-AI, וגם תבטיח שאף משתמש לא יחרוג מהמגבלות של ספק Gemini API (שמיועד לשימוש של כל המשתמשים).
פרטים על הגבלת הקצב של יצירת בקשות לכל משתמש
אלה כמה פרטים חשובים על מגבלות הקצב (מכסות) של Firebase AI Logic API, ובמיוחד על בקשות לדקה (RPM):
הוא מבוסס על 'יצירת בקשות לתוכן' על בסיס משתמש, אזור ודקה, והוא לא מבוסס על מודל.
זוהי הגבלת הקצב שחלה על כל המשתמשים שלכם. נכון לעכשיו, אין אפשרות להגדיר את מגבלת הקצב למשתמש ספציפי או לקבוצה ספציפית של משתמשים*.
היא חלה ברמת הפרויקט ועל כל האפליקציות וכתובות ה-IP שמשתמשות באותו פרויקט Firebase.
היא חלה על כל שיחה שמגיעה ספציפית מכל SDK של Firebase AI Logic.
הגבלת קצב ברירת המחדל היא 100 בקשות לדקה לכל משתמש.
חשוב לזכור שעדיין צריך להתייחס למגבלות של ספק Gemini API (ראו למעלה), שקודמות למגבלות של Firebase AI Logic API.
* אם אתם משתמשים ב-Vertex AI Gemini API והאפליקציה שלכם מפנה משתמשים לאזורים שונים (לדוגמה, באמצעות Firebase Remote Config), תוכלו להגדיר מגבלת קצב ספציפית למשתמשים באזור מסוים.
שינוי הגבלת הקצב 'לכל משתמש'
כדי לשנות את מגבלת הקצב (מכסה), צריך לקבל את ההרשאה serviceusage.quotas.update, שכלולה כברירת מחדל בתפקידים 'בעלים' ו'עריכה'.
כדי לערוך את מגבלת הקצב (המכסה) או לבקש להגדיל אותה:
במסוף Google Cloud, עוברים לדף של Firebase AI Logic API.
לוחצים על ניהול.
בחלק התחתון של הדף, לוחצים על הכרטיסייה Quotas & System Limits.
מסננים את הטבלה כדי להציג את המכסות הרלוונטיות, כמו היכולת (בקשות ליצירת תוכן) והאזור.
לדוגמה, כדי לראות את המכסות לכל משתמש ליצירת בקשות לתוכן באחד מהאזורים הנתמכים באסיה, המסנן ייראה כך:
Generate content requests+Dimension:region:asiaמסמנים את התיבה שמשמאל לכל מכסה שרוצים לראות.
בסוף השורה של המכסה, לוחצים על ואז על עריכת המכסה.
בטופס Quota changes (שינויים במכסת השימוש), מבצעים את הפעולות הבאות:
בשדה ערך חדש, מזינים את המכסה המוגדלת שרוצים להגדיר.
המכסה הזו חלה ברמת הפרויקט ומשותפת לכל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.
ממלאים את שאר השדות בטופס ולוחצים על Done.
לוחצים על Submit request.