تعالج نماذج Gemini المدخلات والمخرجات في وحدات تُعرف باسم الرموز المميزة.
يمكن أن تكون الرموز المميزة أحرفًا مفردة مثل z أو كلمات كاملة مثل cat. يتم تقسيم الكلمات الطويلة إلى عدة رموز مميزة. تُعرف مجموعة الرموز المميزة التي يستخدمها النموذج باسم المفردات، وتُعرف عملية تقسيم النص إلى رموز مميزة باسم التقطيع إلى رموز مميزة.
بالنسبة إلى نماذج Gemini، يعادل الرمز المميز حوالي 4 أحرف. تعادل 100 رمز مميز حوالي 60 إلى 80 كلمة إنجليزية.
لكل نموذج عدد أقصى من الرموز المميزة يمكنه معالجتها في الطلب والرد. من خلال معرفة عدد الرموز المميزة في طلبك، يمكنك معرفة ما إذا كنت قد تجاوزت هذا الحدّ. بالإضافة إلى ذلك، يتم تحديد تكلفة الطلب جزئيًا من خلال عدد الرموز المميزة في الطلب والرد، لذا قد يكون من المفيد معرفة كيفية احتساب الرموز المميزة.
يُرجى العِلم أنّ الطرازَين Gemini 1.0 و1.5 كانا يتيحان أيضًا احتساب "الأحرف القابلة للفوترة" وتحديد أسعارها، ولكن بما أنّ هذه الطُرز إما تم إيقافها نهائيًا أو سيتم إيقافها قريبًا، لا تتضمّن هذه الصفحة أي معلومات حول الأحرف القابلة للفوترة.
النماذج المتوافقة
gemini-2.5-progemini-2.5-flashgemini-2.5-flash-lite-
gemini-2.0-flash-001(والاسم المستعارgemini-2.0-flashالذي يتم تعديله تلقائيًا) -
gemini-2.0-flash-lite-001(والاسم المستعار الذي يتم تعديله تلقائيًاgemini-2.0-flash-lite) gemini-2.0-flash-preview-image-generation
خيارات احتساب الرموز المميزة
يتم تقسيم جميع المدخلات والمخرجات الخاصة بـ Gemini API إلى رموز مميزة، بما في ذلك النصوص وملفات الصور وغيرها من الوسائط غير النصية. في ما يلي خيارات احتساب الرموز المميزة:
- تحقَّق من عدد الرموز المميزة في طلباتك فقط (قبل إرسالها إلى النموذج).
- استدعاء
countTokensمع إدخال الطلب قبل إرساله إلى النموذج تعرض هذه السمة ما يلي:-
total_tokens: عدد الرموز المميّزة للمدخلات فقط
-
- تحقَّق من عدد الرموز المميزة لكل من طلباتك وردودك.
- استخدِم السمة
usageMetadataفي عنصر الردّ. ويشمل ذلك ما يلي:-
prompt_token_count: عدد الرموز المميّزة في الإدخال فقط candidates_token_count: عدد الرموز المميزة في الناتج فقط (لا يشمل الرموز المميزة الخاصة بالتفكير)-
thoughts_token_count: عدد الرموز المميزة الخاصة بالتفكير المستخدَمة لإنشاء الرد total_token_count: إجمالي عدد الرموز المميّزة لكلّ من الإدخال والإخراج (بما في ذلك أي رموز مميّزة خاصة بالتفكير)
عند بث الناتج، لا تظهر السمة
usageMetadataإلا في آخر جزء من البث. القيمة هيnilبالنسبة إلى الأجزاء المتوسطة. -
تجدُر الإشارة إلى النقاط التالية بشأن الخيارات المذكورة أعلاه:
- لن يتم احتساب عدد الصور المدخلة أو عدد الثواني في ملفات الفيديو أو الملفات الصوتية المدخلة. ومع ذلك، فإنّ عدد الرموز المميزة لكل من هذه الوسائط سيتناسب طرديًا مع هذه القيم.
- يشمل عدد الرموز المميزة في الطلب النص وأي ملفات إدخال، بالإضافة إلى أي تعليمات وأدوات خاصة بالنظام.
- لا يتضمّن عدد الرموز المميزة للناتج أي رموز مميزة للتفكير، بل يتم توفيرها في حقل منفصل.
- راجِع المعلومات الإضافية الخاصة بكل نوع من الطلبات لاحقًا في هذه الصفحة.
أسعار هذه الخيارات
الاتصال
countTokens: لا يتم تحصيل أي رسوم مقابل الاتصالcountTokens(واجهة برمجة التطبيقات Count Tokens). الحد الأقصى للحصة المخصّصة لواجهة برمجة التطبيقات Count Tokens هو 3,000 طلب في الدقيقة.استخدام السمة
usageMetadata: يتم عرض هذه السمة دائمًا كجزء من الردّ ولا تتسبّب في أي تكلفة أو رسوم.
معلومات إضافية
في ما يلي بعض المعلومات الإضافية عند التعامل مع أنواع معيّنة من الطلبات.
احتساب الرموز المميزة للإدخال النصي
لا تتوفّر معلومات إضافية.
احتساب الرموز المميّزة المتعددة الدورات (المحادثة)
يُرجى ملاحظة ما يلي عند الاتصال بـ countTokens أثناء استخدام المحادثة:
- إذا طلبت
countTokensمع سجلّ المحادثة، سيتم عرض إجمالي عدد الرموز المميزة من كلا الدورين في المحادثة (total_tokens). - لمعرفة حجم الدور التالي في المحادثة، عليك إضافته إلى السجلّ عند طلب
countTokens.
عدّ الرموز المميزة للإدخال المتعدد الوسائط
تجدُر الإشارة إلى النقاط التالية حول احتساب الرموز المميزة باستخدام الإدخال المتعدّد الوسائط:
- يمكنك اختياريًا استدعاء
countTokensعلى النص والملف بشكل منفصل. - بالنسبة إلى خيارَي احتساب الرموز المميزة، ستحصل على عدد الرموز المميزة نفسه سواء قدّمت الملف كبيانات مضمّنة أو باستخدام عنوان URL الخاص به.
ملفات إدخال الصور
يتم تحويل ملفات إدخال الصور إلى رموز مميزة استنادًا إلى أبعادها:
- مدخلات الصور التي يقل فيها كلا البُعدَين عن 384 بكسل أو يساويها: يتم احتساب 258 رمزًا مميزًا لكل صورة.
- مدخلات الصور التي تكون أكبر في أحد البُعدَين أو كليهما: يتم اقتصاص كل صورة وتغيير حجمها حسب الحاجة إلى مربّعات بحجم 768 × 768 بكسل، ثم يتم احتساب كل مربّع على أنّه 258 رمزًا مميزًا.
ملفات إدخال الفيديو والصوت
يتم تحويل ملفات إدخال الفيديو والصوت إلى رموز مميزة بمعدلات ثابتة على النحو التالي:
- الفيديو: 263 رمزًا مميزًا في الثانية
- الصوت: 32 رمزًا مميزًا في الثانية
ملفات إدخال المستندات (مثل ملفات PDF)
يتم التعامل مع ملفات PDF المدخلة على أنّها صور، لذا يتم تقسيم كل صفحة من ملف PDF إلى رموز مميزة بالطريقة نفسها التي يتم بها تقسيم الصور.