ספירת אסימונים ותווים לחיוב במודלים של Gemini

מודלים גנרטיביים מפרקים את הנתונים ליחידות שנקראות אסימונים לצורך עיבוד. לכל מודל יש מספר אסימונים מקסימלי שהוא יכול לטפל בו בהנחיה ובתגובה.

בדף הזה מוסבר איך משתמשים ב-Count Tokens API כדי לקבל אומדן של מספר האסימונים ומספר התווים שניתנים לחיוב בבקשה למודל Gemini. אין API לקבלת האומדן של האסימונים בתגובה.

חשוב לזכור שאי אפשר להשתמש ב-Count Tokens API במודלים מסוג Imagen.

איזה מידע מוצג בספירה?

חשוב לשים לב לנקודות הבאות לגבי ספירת אסימונים ותווים לחיוב:

  • ספירת מספר האסימונים הכולל

    • הספירה הזו עוזרת לוודא שהבקשות לא חורגות מחלון ההקשר המותר.

    • מספר האסימונים ישקף את הגודל של כל הקבצים (לדוגמה, תמונות) שסופקו כחלק מהקלט של הבקשה. המערכת לא תספור את מספר התמונות או את מספר השניות בסרטון.

    • בכל המודלים של Gemini, אסימון שווה ל-4 תווים בערך. 100 אסימונים הם בערך 60-80 מילים באנגלית.

  • ספירת סך כל התווים לחיוב

    • המספר הזה עוזר לכם להבין את העלויות ולשלוט בהן, כי מספר התווים הוא חלק מחישובי התמחור של Vertex AI.

    • מספר התווים לחיוב ישקף את מספר התווים בטקסט שסופק כחלק מהקלט של הבקשה.

במודלים ישנים יותר מסוג Gemini, האסימונים לא נכללים בחישוב התמחור. לעומת זאת, במודלים מסוג Gemini 2.0, האסימונים נכללים בחישוב התמחור. מידע נוסף על מגבלות האסימונים לכל מודל ומידע נוסף על התמחור לכל מודל

תמחור ומכסה לספירת אסימונים ותווים לחיוב

אין חיוב או הגבלת מכסות על השימוש ב-API של CountTokens. המכסה המקסימלית של ה-API CountTokens היא 3,000 בקשות לדקה (RPM).

דוגמאות קוד

קלט טקסט בלבד

קלט מרובה מצבים