The latest Gemini models, like Gemini 3.6 Flash, are available to use with Firebase AI Logic! Learn more.

All Imagen models will shut down as early as June 30, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ספירת טוקנים במודלים של Gemini

מודלים של Gemini מעבדים קלט ופלט ביחידות שנקראות טוקנים.

אסימונים יכולים להיות תווים בודדים כמו z או מילים שלמות כמו cat. מילים ארוכות מפוצלות לכמה טוקנים. קבוצת כל האסימונים שבהם נעשה שימוש במודל נקראת אוצר מילים, והתהליך של פיצול טקסט לאסימונים נקרא טוקניזציה.

במודלים של Gemini, אסימון שווה בערך ל-4 תווים. ‫100 טוקנים שווים בערך ל-60-80 מילים באנגלית.

לכל מודל יש מספר טוקנים מקסימלי שהוא יכול לטפל בהם בהנחיה ובתשובה. אם יודעים את כמות הטוקנים בהנחיה, אפשר לדעת אם חרגתם מהמגבלה הזו. בנוסף, העלות של בקשה נקבעת בחלקה לפי מספר הטוקנים של הקלט והפלט, ולכן כדאי לדעת איך לספור טוקנים.

מודלים נתמכים

gemini-3.1-pro-preview
‫gemini-3.6-flash (וגם gemini-3.5-flash ישנות יותר)
‫gemini-3.5-flash-lite (וגם gemini-3.1-flash-lite ישנות יותר)
‫gemini-3-pro-image (או Nano Banana Pro)
‫gemini-3.1-flash-image (נקרא גם Nano Banana 2)
‫gemini-3.1-flash-lite-image (נקרא גם Nano Banana 2 Lite)
gemini-2.5-pro
gemini-2.5-flash
gemini-2.5-flash-lite

אפשרויות לספירת טוקנים

כל הקלט והפלט של Gemini API עוברים טוקניזציה, כולל טקסט, קובצי תמונות וסוגים אחרים של נתונים שאינם טקסט. אלה האפשרויות לספירת טוקנים:

בודקים את כמות הטוקנים בבקשות בלבד (לפני ששולחים אותן למודל).

מתקשרים אל countTokens עם הקלט של הבקשה לפני ששולחים אותה למודל. הפלט שמתקבל:

‫total_tokens: כמות הטוקנים של הקלט בלבד

בודקים את כמות הטוקנים גם בבקשות וגם בתשובות.

ניגשים למאפיין usageMetadata באובייקט התגובה. הם כוללים:

prompt_token_count: כמות הטוקנים של הקלט בלבד
‫candidates_token_count: מספר הטוקנים של הפלט בלבד (לא כולל טוקנים של חשיבה)
‫thoughts_token_count: כמות הטוקנים של כל טוקן של חשיבה ששימש ליצירת התשובה
‫total_token_count: ספירה כוללת של הטוקנים של הקלט ושל הפלט (כולל טוקנים של חשיבה)

כשמזרמים פלט, המאפיין usageMetadata מופיע רק בחלק האחרון של הזרם. הערך הוא nil עבור חלקים ביניים.

חשוב לשים לב לנקודות הבאות לגבי האפשרויות שלמעלה:

הם לא יספרו את מספר תמונות הקלט או את מספר השניות בקובצי קלט של וידאו או אודיו. עם זאת, כמות הטוקנים של כל אחת מהשיטות האלה יהיה קשור לערכים האלה.
מספר הטוקנים של הקלט כולל את ההנחיה (טקסט וקבצים של קלט) וגם את ההוראות והכלים של המערכת.
מספר הטוקנים בפלט לא כולל טוקנים של חשיבה, שמסופקים בשדה נפרד.
בהמשך הדף מופיע מידע נוסף שספציפי לכל סוג בקשה.
מודלים של Gemini Live API לא תומכים ב-countTokens. בנוסף, Firebase AI Logic עדיין לא תומך במאפיין usageMetadata בתשובה ממודלים של Live API, אבל התמיכה הזו תהיה זמינה בקרוב.

תמחור האפשרויות האלה

קריאה ל-countTokens: אין חיוב על קריאה ל-countTokens (ה-API של Count Tokens). המכסה המקסימלית של Count Tokens API היא 3,000 בקשות לדקה (RPM).
שימוש במאפיין usageMetadata: המאפיין הזה תמיד מוחזר כחלק מהתשובה, ולא כרוך בשימוש בטוקנים או בחיוב.

מידע נוסף

הנה מידע נוסף על עבודה עם סוגים ספציפיים של בקשות.

ספירת טוקנים של קלט טקסט

אין מידע נוסף.

ספירת טוקנים של שיחות עם זיכרון

כשמתקשרים ב-countTokens באמצעות הצ'אט, חשוב לשים לב לנקודות הבאות:

אם מתקשרים אל countTokens עם היסטוריית הצ'אט, הפונקציה מחזירה את כמות הטוקנים הכוללת משני התפקידים בצ'אט (total_tokens).
כדי להבין מה יהיה גודל התגובה הבאה בשיחה, צריך לצרף אותה להיסטוריה כשמתקשרים אל countTokens.

ספירת טוקנים של קלט מרובה מצבים

חשוב לזכור את הנקודות הבאות לגבי ספירת טוקנים עם קלט רב-אופני:

אפשר גם להתקשר אל countTokens לגבי הטקסט והקובץ בנפרד.
בשתי האפשרויות לספירת טוקנים, תקבלו את אותו מספר טוקנים בין אם תספקו את הקובץ כנתונים מוטבעים או באמצעות כתובת ה-URL שלו.

קובצי קלט של תמונות

קבצים של תמונות קלט מומרים לטוקנים על סמך המידות שלהם:

תשומות של תמונות ששני הממדים שלהן קטנים מ-384 פיקסלים או שווים להן: כל תמונה נספרת כ-258 טוקנים.
תמונות קלט שגדולות יותר באחד מהממדים או בשניהם: כל תמונה נחתכת ומשנה את הגודל לפי הצורך לאריחים בגודל 768x768 פיקסלים, ואז כל אריח נספר כ-258 טוקנים.

קובצי קלט של וידאו ואודיו

קובצי וידאו ואודיו להזנה מומרים לטוקנים בשיעורים הקבועים הבאים:

סרטון: 263 טוקנים לשנייה
אודיו: 32 טוקנים לשנייה

קבצי קלט של מסמכים (כמו קובצי PDF)

קובצי PDF שמוזנים נחשבים לתמונות, ולכן כל דף בקובץ PDF עובר טוקניזציה באותו אופן כמו תמונה.