تعالج نماذج Gemini الطلبات والردود بوحدات تُعرف باسم الرموز المميّزة.
يمكن أن تكون الرموز المميّزة أحرفًا مفردة، مثل z، أو كلمات كاملة، مثل cat. ويتم تقسيم الكلمات الطويلة إلى عدة رموز مميّزة. تُعرف مجموعة جميع الرموز المميّزة التي يستخدمها النموذج باسم المفردات، وتُعرف عملية تقسيم النص إلى رموز مميّزة باسم الترميز.
بالنسبة إلى نماذج Gemini، يعادل الرمز المميّز الواحد 4 أحرف تقريبًا. ويعادل 100 رمز مميّز من 60 إلى 80 كلمة باللغة الإنجليزية تقريبًا.
لكل نموذج عدد أقصى من الرموز المميّزة التي يمكنه معالجتها في طلب وردّ. ويتيح لك معرفة عدد الرموز المميّزة في طلبك معرفة ما إذا تجاوزت هذا الحدّ. بالإضافة إلى ذلك، يتم تحديد تكلفة الطلب جزئيًا حسب عدد الرموز المميّزة للطلب والردّ، لذا يمكن أن يكون من المفيد معرفة كيفية عدّ الرموز المميّزة.
النماذج المتوافقة
gemini-3.1-pro-previewgemini-3-flash-previewgemini-3.1-flash-lite-previewgemini-3-pro-image-previewgemini-3.1-flash-image-previewgemini-2.5-progemini-2.5-flashgemini-2.5-flash-litegemini-2.0-flash-001(والاسم المستعار الذي يتم تعديله تلقائيًاgemini-2.0-flash)gemini-2.0-flash-lite-001(والاسم المستعار الذي يتم تعديله تلقائيًاgemini-2.0-flash-lite)
خيارات عدّ الرموز المميّزة
يتم تقسيم جميع المدخلات والمخرجات في Gemini API إلى رموز مميّزة، بما في ذلك النصوص وملفات الصور والأنماط الأخرى غير النصية. في ما يلي خيارات عدّ الرموز المميّزة:
- يمكنك الاطّلاع على عدد الرموز المميّزة لـ طلباتك فقط (قبل إرسالها إلى النموذج).
- يمكنك استدعاء
countTokensمع إدخال الطلب قبل إرساله إلى النموذج. ويؤدي ذلك إلى عرض ما يلي:total_tokens: عدد الرموز المميّزة للإدخال فقط
- يمكنك الاطّلاع على عدد الرموز المميّزة لكلا من طلباتك وردودك.
- يمكنك الوصول إلى السمة
usageMetadataفي عنصر الردّ. ويتضمّن ذلك ما يلي:prompt_token_count: عدد الرموز المميّزة للإدخال فقطcandidates_token_count: عدد الرموز المميّزة للناتج فقط (لا يشمل رموز التفكير)thoughts_token_count: عدد الرموز المميّزة لأي رموز تفكير مستخدَمة لإنشاء الردّtotal_token_count: العدد الإجمالي للرموز المميّزة لـ كلا من الإدخال والناتج (يشمل أي رموز تفكير)
عند تشغيل الناتج بشكل مستمر، لا تظهر السمة
usageMetadataإلا في آخر جزء من التشغيل المستمر. وتكون قيمتهاnilللأجزاء الوسيطة.
يُرجى مراعاة النقاط التالية حول الخيارات أعلاه:
- لن يتم عدّ عدد الصور المُدخَلة أو عدد الثواني في ملفات إدخال الفيديو أو الصوت. ومع ذلك، فإنّ عدد الرموز المميّزة لكل من هذه الأنماط مرتبط بهذه القيم.
- يشمل عدد الرموز المميّزة للإدخال الطلب (النص وأي ملفات إدخال) بالإضافة إلى أي تعليمات وأدوات للنظام.
- لا يشمل عدد الرموز المميّزة للناتج أي رموز تفكير، ويتم تقديمها في حقل منفصل.
- يُرجى مراجعة الـ معلومات الإضافية الخاصة بكل نوع من أنواع الطلبات لاحقًا في هذه الصفحة.
- لا تتوافق نماذج Gemini Live API مع
لا تدعم
countTokens. بالإضافة إلى ذلك، لا تتوافق ميزة Firebase AI Logic بعد مع سمةusageMetadataفي الردّ من Live API النماذج، ولكن سيتم توفيرها قريبًا.
الأسعار لهذه الخيارات
استدعاء
countTokens: لا يتم تحصيل أي رسوم مقابل استدعاءcountTokens(واجهة برمجة التطبيقات Count Tokens). الحدّ الأقصى لحصة Count Tokens API هو 3000 طلب في الدقيقة.استخدام السمة
usageMetadata: يتم عرض هذه السمة دائمًا كجزء من الردّ ولا تتكبّد أي رموز مميّزة أو رسوم مقابلها.
معلومات إضافية
في ما يلي بعض المعلومات الإضافية عند استخدام أنواع معيّنة من الطلبات.
عدّ الرموز المميّزة للإدخال النصي
لا تتوفّر معلومات إضافية.
عدّ الرموز المميّزة للمحادثات المتعدّدة الجولات (المحادثة)
يُرجى مراعاة ما يلي عند استدعاء countTokens عند استخدام المحادثة:
- إذا استدعيت
countTokensباستخدام سجلّ المحادثة، سيعرض العدد الإجمالي للرموز المميّزة من كلا الدورَين في المحادثة (total_tokens). - لمعرفة حجم دور المحادثة التالي، عليك إلحاقه بالسجلّ عند استدعاء
countTokens.
عدّ الرموز المميّزة للإدخال المتعدد الوسائط
يُرجى مراعاة النقاط التالية حول عدّ الرموز المميّزة باستخدام الإدخال المتعدد الوسائط:
- يمكنك اختياريًا استدعاء
countTokensعلى النص والملف بشكل منفصل. - بالنسبة إلى كلا خيارَي عدّ الرموز المميّزة، ستحصل على عدد الرموز المميّزة نفسه سواء قدّمت الملف كبيانات مضمّنة أو باستخدام عنوان URL الخاص به.
ملفات إدخال الصور
يتم تحويل ملفات إدخال الصور إلى رموز مميّزة استنادًا إلى أبعادها:
- ملفات إدخال الصور التي يكون كلا بُعدَيها أقل من 384 بكسل أو يساويهما: يتم عدّ كل صورة على أنّها 258 رمزًا مميّزًا.
- ملفات إدخال الصور التي تكون أكبر في أحد البُعدَين أو كليهما: يتم اقتصاص كل صورة وتغيير حجمها حسب الحاجة إلى مربّعات بحجم 768 × 768 بكسل، ثم يتم عدّ كل مربّع على أنّه 258 رمزًا مميّزًا.
ملفات إدخال الفيديو والصوت
يتم تحويل ملفات إدخال الفيديو والصوت إلى رموز مميّزة بالمعدّلات الثابتة التالية:
- الفيديو: 263 رمزًا مميّزًا في الثانية
- الصوت: 32 رمزًا مميّزًا في الثانية
ملفات إدخال المستندات (مثل ملفات PDF)
يتم التعامل مع ملفات إدخال PDF على أنّها صور، لذا يتم ترميز كل صفحة من ملف PDF بالطريقة نفسها التي يتم بها ترميز الصورة.