מודלים של AI גנרטיבי (כמו המודלים של Gemini) מפרקים את הנתונים ליחידות שנקראות אסימונים לצורך עיבוד. לכל מודל של Gemini יש מספר אסימונים מקסימלי שהוא יכול לטפל בהם בהנחיה ובתגובה.
בדף הזה מוסבר איך לקבל אומדן של מספר האסימונים ומספר התווים שניתנים לחיוב בבקשה.
איזה מידע מוצג בספירה?
חשוב לשים לב לנקודות הבאות לגבי ספירת אסימונים ותווים לחיוב:
ספירת מספר האסימונים הכולל
הספירה הזו עוזרת לוודא שהבקשות לא חורגות מחלון ההקשר המותר.
מספר האסימונים ישקף את הגודל של כל הקבצים (לדוגמה, תמונות) שסופקו כחלק מהקלט של הבקשה. המערכת לא תספור את מספר התמונות או את מספר השניות בסרטון.
בכל המודלים של Gemini, אסימון שווה ל-4 תווים בערך. 100 אסימונים הם כ-60-80 מילים באנגלית.
ספירת סך כל התווים לחיוב
המספר הזה עוזר לכם להבין את העלויות ולשלוט בהן, כי מספר התווים הוא חלק מהחישוב של התמחור ב-Vertex AI.
מספר התווים לחיוב ישקף את מספר התווים בטקסט שסופק כחלק מהקלט של הבקשה.
עבור Vertex AI, האסימונים לא נכללים בחישוב התמחור. מידע נוסף על מגבלות האסימונים לכל מודל ומידע נוסף על התמחור לכל מודל
תמחור ומכסה לספירת אסימונים ותווים לחיוב
אין חיוב או הגבלת מכסות על השימוש ב-API של CountTokens
. המכסה המקסימלית של ה-API של CountTokens
היא 3,000 בקשות לדקה.