تعالج نماذج Gemini الإدخال والإخراج بوحدات تُعرف باسم الرموز المميّزة.
يمكن أن تكون الرموز المميّزة أحرفًا مفردة، مثل z، أو كلمات كاملة، مثل cat. ويتم تقسيم الكلمات الطويلة إلى عدة رموز مميّزة. تُعرف مجموعة جميع الرموز المميّزة التي يستخدمها النموذج باسم المفردات، وتُعرف عملية تقسيم النص إلى رموز مميّزة باسم الترميز.
بالنسبة إلى نماذج Gemini، يعادل الرمز المميّز الواحد 4 أحرف تقريبًا. ويعادل 100 رمز مميّز حوالي 60 إلى 80 كلمة باللغة الإنجليزية.
لكل نموذج عدد أقصى من الرموز المميّزة التي يمكنه معالجتها في الطلب والردّ. من خلال معرفة عدد الرموز المميّزة في طلبك، يمكنك معرفة ما إذا تجاوزت هذا الحدّ. بالإضافة إلى ذلك، يتم تحديد تكلفة الطلب جزئيًا حسب عدد الرموز المميّزة للإدخال والإخراج، لذا يمكن أن يكون من المفيد معرفة كيفية حساب الرموز المميّزة.
النماذج المتوافقة
gemini-3.1-pro-previewgemini-3.5-flashgemini-3.1-flash-litegemini-3-pro-imagegemini-3.1-flash-imagegemini-2.5-progemini-2.5-flashgemini-2.5-flash-lite
خيارات حساب الرموز المميّزة
يتم ترميز جميع الإدخالات والإخراجات لـ Gemini API، بما في ذلك النصوص وملفات الصور وأنماط البيانات الأخرى غير النصية. في ما يلي خيارات حساب الرموز المميّزة:
- تحقَّق من عدد الرموز المميّزة لـ طلباتك فقط (قبل إرسالها إلى النموذج).
- استدعِ
countTokensباستخدام إدخال الطلب قبل إرساله إلى النموذج. يؤدي ذلك إلى عرض ما يلي:total_tokens: عدد الرموز المميّزة للإدخال فقط
- تحقَّق من عدد الرموز المميّزة لكلا من طلباتك وردودك.
- يمكنك الوصول إلى سمة
usageMetadataفي عنصر الردّ. ويشمل ذلك ما يلي:prompt_token_count: عدد الرموز المميّزة للإدخال فقطcandidates_token_count: عدد الرموز المميّزة للإخراج فقط (لا يشمل رموز التفكير المميّزة)thoughts_token_count: عدد الرموز المميّزة لأي رموز تفكير مميّزة مستخدَمة لإنشاء الردّtotal_token_count: العدد الإجمالي للرموز المميّزة لـ كلا من الإدخال والإخراج (يشمل أي رموز تفكير مميّزة)
عند تشغيل الإخراج بشكل مستمر، لا تظهر سمة
usageMetadataإلا في آخر جزء من التشغيل المستمر. وتكون قيمتهاnilللأجزاء الوسيطة.
يُرجى مراعاة النقاط التالية حول الخيارات أعلاه:
- لن تحسب هذه الخيارات عدد الصور التي تم إدخالها أو عدد الثواني في ملفات إدخال الفيديو أو الصوت. ومع ذلك، فإنّ عدد الرموز المميّزة لكل من أنماط البيانات هذه سيكون مرتبطًا بهذه القيم.
- يشمل عدد الرموز المميّزة للإدخال الطلب (النص وأي ملفات إدخال) بالإضافة إلى أي تعليمات وأدوات للنظام.
- لا يشمل عدد الرموز المميّزة للإخراج أي رموز تفكير مميّزة، ويتم تقديمها في حقل منفصل.
- راجِع المعلومات الإضافية الخاصة بكل نوع من أنواع الطلبات لاحقًا في هذه الصفحة.
- لا تتوافق نماذج Gemini Live API مع
لا تدعم
countTokens. بالإضافة إلى ذلك، لا تتوافق ميزة Firebase AI Logic بعد مع سمةusageMetadataفي الردّ من Live API، ولكنّها ستكون متاحة قريبًا.
الأسعار لهذه الخيارات
استدعاء
countTokens: لا يتم تحصيل أي رسوم مقابل استدعاءcountTokens(واجهة برمجة التطبيقات Count Tokens API). الحدّ الأقصى لحصة Count Tokens API هو 3000 طلب في الدقيقة.استخدام سمة
usageMetadata: يتم عرض هذه السمة دائمًا كجزء من الردّ ولا تتكبّد أي رموز مميّزة أو رسوم.
معلومات إضافية
في ما يلي بعض المعلومات الإضافية عند استخدام أنواع معيّنة من الطلبات.
حساب الرموز المميّزة للإدخال النصي
لا تتوفّر معلومات إضافية.
حساب الرموز المميّزة للمحادثة المترابطة (الدردشة)
يُرجى مراعاة ما يلي عند استدعاء countTokens عند استخدام المحادثة:
- إذا استدعيت
countTokensباستخدام سجلّ المحادثة، سيعرض العدد الإجمالي للرموز المميّزة من كلا الدورَين في المحادثة (total_tokens). - لمعرفة حجم دور المحادثة التالي، عليك إلحاقه بالسجلّ عند استدعاء
countTokens.
حساب الرموز المميّزة للإدخال المتعدّد الوسائط
يُرجى مراعاة النقاط التالية حول حساب الرموز المميّزة باستخدام الإدخال المتعدّد الوسائط:
- يمكنك اختياريًا استدعاء
countTokensعلى النص والملف بشكل منفصل. - بالنسبة إلى كلا خيارَي حساب الرموز المميّزة، ستحصل على عدد الرموز المميّزة نفسه سواء قدّمت الملف كبيانات مضمّنة أو باستخدام عنوان URL الخاص به.
ملفات إدخال الصور
يتم تحويل ملفات إدخال الصور إلى رموز مميّزة استنادًا إلى أبعادها:
- إدخالات الصور التي يكون كلا بُعدَيها أقل من 384 بكسل أو يساويهما: يتم احتساب كل صورة على أنّها 258 رمزًا مميّزًا.
- إدخالات الصور التي يكون أحد بُعدَيها أو كلاهما أكبر: يتم اقتصاص كل صورة وتغيير حجمها حسب الحاجة إلى مربّعات بحجم 768 × 768 بكسل، ثم يتم احتساب كل مربّع على أنّه 258 رمزًا مميّزًا.
ملفات إدخال الفيديو والصوت
يتم تحويل ملفات إدخال الفيديو والصوت إلى رموز مميّزة بالمعدّلات الثابتة التالية:
- الفيديو: 263 رمزًا مميّزًا في الثانية
- الصوت: 32 رمزًا مميّزًا في الثانية
ملفات إدخال المستندات (مثل ملفات PDF)
تُعامَل ملفات إدخال PDF على أنّها صور، لذا يتم ترميز كل صفحة من ملف PDF بالطريقة نفسها التي يتم بها ترميز الصورة.