تعالج نماذج Gemini المدخلات والمخرجات في وحدات تُعرف باسم الرموز المميزة.
يمكن أن تكون الرموز المميزة أحرفًا مفردة مثل z أو كلمات كاملة مثل cat. يتم تقسيم الكلمات الطويلة إلى عدة رموز مميزة. تُعرف مجموعة جميع الرموز المميزة التي يستخدمها النموذج باسم المفردات، وتُعرف عملية تقسيم النص إلى رموز مميزة باسم التقطيع إلى رموز مميزة.
بالنسبة إلى نماذج Gemini، يعادل الرمز المميز حوالي 4 أحرف. تعادل 100 رمز مميز حوالي 60 إلى 80 كلمة إنجليزية.
لكل نموذج عدد أقصى من الرموز المميزة يمكنه معالجتها في الطلب والاستجابة. من خلال معرفة عدد الرموز المميزة في طلبك، يمكنك معرفة ما إذا كنت قد تجاوزت هذا الحدّ. بالإضافة إلى ذلك، يتم تحديد تكلفة الطلب جزئيًا من خلال عدد الرموز المميزة الخاصة بالمدخلات والمخرجات، لذا قد يكون من المفيد معرفة كيفية احتساب الرموز المميزة.
يُرجى العِلم أنّ الطرازَين Gemini 1.0 و1.5 كانا يتيحان أيضًا احتساب "الأحرف القابلة للفوترة" وتحديد أسعارها، ولكن بما أنّ هذه الطرازات إما تم إيقافها نهائيًا أو سيتم إيقافها قريبًا، لا تتضمّن هذه الصفحة أي معلومات حول الأحرف القابلة للفوترة.
النماذج المتوافقة
gemini-3-pro-previewgemini-2.5-progemini-2.5-flashgemini-2.5-flash-lite-
gemini-2.0-flash-001(والاسم المستعارgemini-2.0-flashالذي يتم تعديله تلقائيًا) -
gemini-2.0-flash-lite-001(والاسم المستعار الذي يتم تعديله تلقائيًاgemini-2.0-flash-lite) gemini-2.0-flash-preview-image-generation
خيارات احتساب الرموز المميزة
يتم تقسيم جميع المدخلات والمخرجات الخاصة بـ Gemini API إلى رموز مميزة، بما في ذلك النصوص وملفات الصور وغيرها من الوسائط غير النصية. في ما يلي خيارات احتساب الرموز المميزة:
- تحقَّق من عدد الرموز المميزة لطلباتك فقط (قبل إرسالها إلى النموذج).
- استدعِ الدالة
countTokensمع إدخال الطلب قبل إرساله إلى النموذج. تعرض هذه السمة ما يلي:-
total_tokens: عدد الرموز المميّزة للمدخلات فقط
-
- تحقَّق من عدد الرموز المميزة لكلّ من طلباتك وردودك.
- استخدِم السمة
usageMetadataفي عنصر الردّ. ويشمل ذلك:-
prompt_token_count: عدد الرموز المميّزة في الإدخال فقط candidates_token_count: عدد الرموز المميزة في الناتج فقط (لا يشمل الرموز المميزة الخاصة بالتفكير)-
thoughts_token_count: عدد الرموز المميزة الخاصة بالتفكير المستخدَمة لإنشاء الرد total_token_count: إجمالي عدد الرموز المميّزة لكلّ من الإدخال والإخراج (بما في ذلك أي رموز مميّزة خاصة بالتفكير)
عند بث الناتج، لا تظهر السمة
usageMetadataإلا في آخر جزء من البث. القيمة هيnilبالنسبة إلى الأجزاء المتوسطة. -
تجدُر الإشارة إلى النقاط التالية بشأن الخيارات أعلاه:
- لن يتم احتساب عدد الصور المدخلة أو عدد الثواني في ملفات الفيديو أو الصوت المدخلة. ومع ذلك، فإنّ عدد الرموز المميزة لكل من هذه الوسائط سيتناسب طرديًا مع هذه القيم.
- يشمل عدد الرموز المميزة في الطلب الطلب (النص وأي ملفات إدخال) بالإضافة إلى أي تعليمات وأدوات خاصة بالنظام.
- لا يتضمّن عدد الرموز المميزة للناتج أي رموز مميزة للتفكير، بل يتم توفيرها في حقل منفصل.
- راجِع المعلومات الإضافية الخاصة بكل نوع من الطلبات لاحقًا في هذه الصفحة.
أسعار هذه الخيارات
الاتصال
countTokens: لا يتم تحصيل أي رسوم مقابل الاتصالcountTokens(واجهة برمجة التطبيقات Count Tokens). الحد الأقصى للحصة المتاحة لواجهة برمجة التطبيقات Count Tokens هو 3,000 طلب في الدقيقة.استخدام السمة
usageMetadata: يتم عرض هذه السمة دائمًا كجزء من الردّ ولا تتكبّد أي رموز مميّزة أو رسوم.
معلومات إضافية
في ما يلي بعض المعلومات الإضافية عند التعامل مع أنواع معيّنة من الطلبات.
احتساب الرموز المميزة للإدخال النصي
ما مِن معلومات إضافية.
احتساب الرموز المميزة للمحادثات المتعددة الجولات
يُرجى ملاحظة ما يلي عند الاتصال بـ countTokens أثناء استخدام المحادثة:
- إذا طلبت
countTokensمع سجلّ المحادثات، سيتم عرض إجمالي عدد الرموز المميزة من كلا الدورين في المحادثة (total_tokens). - لمعرفة حجم الدور التالي في المحادثة، عليك إضافته إلى السجلّ عند طلب
countTokens.
عدّ الرموز المميزة للإدخال المتعدد الوسائط
تجدُر الإشارة إلى النقاط التالية حول احتساب الرموز المميزة باستخدام الإدخال المتعدّد الوسائط:
- يمكنك اختياريًا الاتصال بـ
countTokensبشأن النص والملف بشكل منفصل. - بالنسبة إلى خيارَي احتساب الرموز المميزة، ستحصل على عدد الرموز المميزة نفسه سواء قدّمت الملف كبيانات مضمّنة أو باستخدام عنوان URL الخاص به.
ملفات إدخال الصور
يتم تحويل ملفات إدخال الصور إلى رموز مميزة استنادًا إلى أبعادها:
- مدخلات الصور التي يقل فيها كلا البُعدَين عن 384 بكسل أو يساويها: يتم احتساب 258 رمزًا مميزًا لكل صورة.
- مدخلات الصور التي تكون أكبر في أحد البُعدَين أو كليهما: يتم اقتصاص كل صورة وتغيير حجمها حسب الحاجة إلى مربّعات بحجم 768 × 768 بكسل، ثم يتم احتساب كل مربّع على أنّه 258 رمزًا مميزًا.
ملفات إدخال الفيديو والصوت
يتم تحويل ملفات إدخال الفيديو والصوت إلى رموز مميزة بمعدلات ثابتة على النحو التالي:
- الفيديو: 263 رمزًا مميزًا في الثانية
- الصوت: 32 رمزًا مميزًا في الثانية
ملفات إدخال المستندات (مثل ملفات PDF)
يتم التعامل مع ملفات PDF المدخلة على أنّها صور، لذا يتم تقسيم كل صفحة من ملف PDF إلى رموز بالطريقة نفسها التي يتم بها تقسيم الصور.