|
לוחצים על הספק Gemini API כדי לראות בדף הזה תוכן וקוד שספציפיים לספק. |
הגבלות על קצב שליחת בקשות (שנקראות בדרך כלל מכסות) קובעות את מספר הבקשות שאפשר לשלוח אל Gemini API בפרק זמן נתון. המגבלות האלה עוזרות לנו לוודא שיש שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.
כשמשתמשים ב-Firebase AI Logic כדי לשלוח בקשות למודלים של Gemini ושל Imagen, מגבלות הקצב של הפרויקט תלויות בפלאגין שמתממשק עם שירותים חיצוניים Gemini API שבחרתם. Firebase AI Logic מספקת גם דרך להגדיר מגבלות קצב 'לכל משתמש'.
הצגת מגבלות התעריפים של Gemini Developer API
אם תחרגו מהמכסה או אם הקיבולת של המודל שאליו אתם ניגשים תמוצה, תקבלו הודעת שגיאה 429.
הסבר על מגבלות קצב (מכסות)
מגבלות התעריפים (מכסות) נמדדות לפי ארבעה מאפיינים:
- בקשות לדקה (RPM)
- בקשות ביום (RPD)
- טוקנים לדקה (TPM)
- טוקנים ליום (TPD)
השימוש שלכם נבדק מול כל מגבלה, וחריגה מאחת מהן תגרום לשגיאה 429 (חריגה מהמכסה). לדוגמה, אם מגבלת ה-RPM היא 20, שליחת 21 בקשות בתוך דקה תגרום לשגיאה, גם אם לא חרגתם ממגבלת ה-TPM או ממגבלות אחרות.
המגבלות על קצב הבקשות חלות ברמת הפרויקט, על כל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.
המגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מהמגבלות חלות רק על מודלים ספציפיים. לדוגמה, המדד 'תמונות לדקה' (IPM) מחושב רק עבור מודלים שיכולים ליצור תמונות (Imagen), אבל הוא דומה מבחינה רעיונית למדד 'אסימונים לדקה' (TPM).
מכסות ליצירת בקשות מוגבלות יותר במודלים ניסיוניים ובמודלים בגרסת טרום-השקה (Preview).
בקשה להגדלת מגבלת קצב הבקשות
אם אתם משתמשים ב-Gemini Developer API בתוכנית בתשלום, אתם יכולים לבקש להגדיל את המגבלה על קצב יצירת הבקשות.
הגדרת הגבלות קצב 'לכל משתמש'
כדי להשתמש ב-Firebase AI Logic, צריך להפעיל בפרויקט את ספק Firebase AI Logic שבחרתם, אבל צריך גם להפעיל את Firebase AI Logic API, שמשמש כשער בין ערכות ה-SDK של הלקוח לבין ספק Firebase AI Logic.Gemini APIGemini API ה-API הזה מופעל בשבילכם כשמגדירים את Firebase AI Logic בפרויקט Firebase.
אתם יכולים להשתמש במכסה של Firebase AI Logic API כהגבלה על קצב שליחת בקשות 'לכל משתמש' באפליקציה שלכם, במיוחד לתכונות מבוססות-AI שמסתמכות על Firebase AI Logic. מומלץ להגדיר את המכסה הזו כך שתאפשר למשתמש יחיד לגשת לתכונות ה-AI, וגם תבטיח שאף משתמש לא יחרוג מהמכסות של ספק Gemini API (שמיועד לשיתוף בין כל המשתמשים).
פרטים על הגבלת הקצב של יצירת בקשות לכל משתמש
אלה כמה פרטים חשובים לגבי מגבלות הקצב (מכסות) של Firebase AI Logic API – במיוחד, בקשות לדקה (RPM):
הוא מבוסס על 'יצירת בקשות לתוכן' על בסיס משתמש, אזור ודקה, והוא לא מבוסס על מודל.
זוהי הגבלת הקצב שחלה על כל המשתמשים שלכם. בשלב הזה, אין אפשרות להגדיר את מגבלת הקצב למשתמש ספציפי או לקבוצה ספציפית של משתמשים*.
היא חלה ברמת הפרויקט ועל כל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.
היא חלה על כל שיחה שמגיעה ספציפית מכל SDK של Firebase AI Logic.
הגבלת הקצב שמוגדרת כברירת מחדל היא 100 בקשות לדקה לכל משתמש.
חשוב לזכור שעדיין צריך להתייחס למגבלות של ספק Gemini API (פירוט למעלה), שמקבלות עדיפות על פני Firebase AI Logic API.
* אם אתם משתמשים ב-Vertex AI Gemini API והאפליקציה שלכם מפנה משתמשים לאזורים שונים (לדוגמה, באמצעות Firebase Remote Config), תוכלו להגדיר מגבלת קצב ספציפית למשתמשים באזור מסוים.
שינוי הגבלת הקצב 'לכל משתמש'
כדי לשנות את מגבלת הקצב (מכסה), צריך לקבל את ההרשאה serviceusage.quotas.update, שכלולה כברירת מחדל בתפקידים 'בעלים' ו'עריכה'.
כדי לערוך את מגבלת הקצב (המכסה) או לבקש להגדיל אותה:
במסוף Google Cloud, עוברים לדף של Firebase AI Logic API.
לוחצים על ניהול.
בחלק התחתון של הדף, לוחצים על הכרטיסייה Quotas & System Limits.
מסננים את הטבלה כדי להציג את המכסות הרלוונטיות, כמו היכולת (בקשות ליצירת תוכן) והאזור.
לדוגמה, כדי לראות את המכסות לכל משתמש ליצירת בקשות לתוכן בכל אחד מהאזורים הנתמכים באסיה, המסנן ייראה כך:
Generate content requests+Dimension:region:asiaמסמנים את התיבה שמימין לכל מכסה שרוצים לראות.
בסוף השורה של המכסה, לוחצים על ואז על Edit quota.
בטופס Quota changes (שינויים במכסת השימוש), מבצעים את הפעולות הבאות:
בשדה ערך חדש, מזינים את המכסה המוגדלת.
המכסה הזו חלה ברמת הפרויקט ומשותפת לכל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.
ממלאים את שאר השדות בטופס ולוחצים על Done.
לוחצים על Submit request.