מודלים של Gemini מעבדים קלט ופלט ביחידות שנקראות טוקנים.
האסימונים יכולים להיות תווים בודדים כמו z או מילים שלמות כמו cat. מילים ארוכות
מפוצלות לכמה טוקנים. קבוצת כל האסימונים שבהם נעשה שימוש במודל נקראת אוצר המילים, והתהליך של פיצול הטקסט לאסימונים נקרא טוקניזציה.
במודלים של Gemini, אסימון שווה בערך ל-4 תווים. 100 טוקנים שווים בערך ל-60 עד 80 מילים באנגלית.
לכל מודל יש מספר מקסימלי של טוקנים שהוא יכול לטפל בהם בהנחיה ובתגובה. אם תדעו כמה טוקנים יש בהנחיה, תוכלו לדעת אם חרגתם מהמגבלה. בנוסף, העלות של בקשה נקבעת בחלקה לפי מספר הטוקנים של הקלט והפלט, ולכן כדאי לדעת איך לספור טוקנים.
מודלים נתמכים
gemini-3.1-pro-previewgemini-3-flash-previewgemini-3.1-flash-lite-previewgemini-3-pro-image-previewgemini-3.1-flash-image-previewgemini-2.5-progemini-2.5-flashgemini-2.5-flash-litegemini-2.0-flash-001(וכתובת האימייל החלופית שלה שמתעדכנת אוטומטיתgemini-2.0-flash)gemini-2.0-flash-lite-001(וכתובת האימייל החלופית שמתעדכנת אוטומטיתgemini-2.0-flash-lite)
אפשרויות לספירת טוקנים
כל הקלט והפלט של Gemini API עוברים טוקניזציה, כולל טקסט, קובצי תמונות וסוגים אחרים של נתונים שאינם טקסט. אלה האפשרויות לספירת טוקנים:
- בודקים את מספר הטוקנים רק בבקשות (לפני ששולחים אותן למודל).
- מתקשרים אל
countTokensעם הקלט של הבקשה לפני ששולחים אותה אל המודל. הפלט שמתקבל:-
total_tokens: מספר האסימונים של הקלט בלבד
-
- בודקים את מספר הטוקנים גם בבקשות וגם בתשובות.
- ניגשים למאפיין
usageMetadataבאובייקט התגובה. הם כוללים:prompt_token_count: מספר האסימונים של הקלט בלבד-
candidates_token_count: מספר האסימונים של הפלט בלבד (לא כולל אסימוני חשיבה) -
thoughts_token_count: מספר האסימונים של אסימוני חשיבה ששימשו ליצירת התגובה -
total_token_count: ספירה כוללת של האסימונים עבור הקלט והפלט (כולל אסימונים של חשיבה)
כשמבצעים סטרימינג של פלט, המאפיין
usageMetadataמופיע רק בחלק האחרון של הסטרימינג. הערך הואnilעבור חלקים בינוניים.
חשוב לשים לב לנקודות הבאות לגבי האפשרויות שלמעלה:
- הם לא יספרו את מספר תמונות הקלט או את מספר השניות בקובצי קלט של וידאו או אודיו. עם זאת, מספר הטוקנים של כל אחת מהשיטות האלה יהיה קשור לערכים האלה.
- מספר האסימונים של הקלט כולל את ההנחיה (טקסט וקבצים של קלט) וגם את ההוראות והכלים של המערכת.
- מספר האסימונים בפלט לא כולל אסימוני חשיבה. האסימונים האלה מופיעים בשדה נפרד.
- בהמשך הדף מופיע מידע נוסף שספציפי לכל סוג בקשה.
- מודלים של Gemini Live API לא תומכים ב-
countTokens. בנוסף, Firebase AI Logic עדיין לא תומך במאפייןusageMetadataבתשובה ממודלים של Live API, אבל התמיכה תהיה זמינה בקרוב.
תמחור של האפשרויות האלה
קריאה ל-
countTokens: אין חיוב על קריאה ל-countTokens(ה-API של Count Tokens). המכסה המקסימלית של Count Tokens API היא 3,000 בקשות לדקה (RPM).שימוש במאפיין
usageMetadata: המאפיין הזה תמיד מוחזר כחלק מהתשובה, ולא כרוך בשימוש באסימונים או בחיוב.
מידע נוסף
הנה מידע נוסף על עבודה עם סוגים ספציפיים של בקשות.
ספירת טוקנים של קלט טקסט
אין מידע נוסף.
ספירת טוקנים של שיחות עם זיכרון
כשמתקשרים ב-countTokens באמצעות הצ'אט, חשוב לזכור את הדברים הבאים:
- אם מתקשרים אל
countTokensעם היסטוריית הצ'אט, הפונקציה מחזירה את המספר הכולל של הטוקנים משני התפקידים בצ'אט (total_tokens). - כדי להבין מה יהיה גודל התגובה הבאה בשיחה, צריך לצרף אותה להיסטוריה כשמתקשרים אל
countTokens.
ספירת טוקנים של קלט מולטי-מודאלי
חשוב לשים לב לנקודות הבאות לגבי ספירת טוקנים עם קלט מולטימודאלי:
- אפשר גם להתקשר אל
countTokensבנפרד לגבי הטקסט והקובץ. - בשתי האפשרויות לספירת טוקנים, תקבלו את אותו מספר טוקנים בין אם תספקו את הקובץ כנתונים מוטבעים או באמצעות כתובת ה-URL שלו.
קובצי קלט של תמונות
קבצים של תמונות קלט מומרים לטוקנים על סמך המידות שלהם:
- תשומות של תמונות עם שני הממדים שקטנים או שווים ל-384 פיקסלים: כל תמונה נספרת כ-258 טוקנים.
- תמונות קלט שגדולות יותר באחד מהממדים או בשניהם: כל תמונה נחתכת ומשנה את הגודל לפי הצורך לאריחים בגודל 768x768 פיקסלים, ואז כל אריח נספר כ-258 טוקנים.
קובצי קלט של וידאו ואודיו
קובצי וידאו ואודיו להזנה מומרים לטוקנים בשיעורים הקבועים הבאים:
- סרטון: 263 טוקנים לשנייה
- אודיו: 32 טוקנים לשנייה
קובצי קלט של מסמכים (כמו קובצי PDF)
קובצי PDF שמוזנים נחשבים לתמונות, ולכן כל דף בקובץ PDF עובר טוקניזציה באותו אופן כמו תמונה.