احتساب الرموز المميزة لنماذج Gemini

تعالج نماذج Gemini المدخلات والمخرجات في وحدات تُعرف باسم الرموز المميزة.

يمكن أن تكون الرموز المميزة أحرفًا مفردة مثل z أو كلمات كاملة مثل cat. يتم تقسيم الكلمات الطويلة إلى عدة رموز مميزة. تُعرف مجموعة الرموز المميزة التي يستخدمها النموذج باسم المفردات، وتُعرف عملية تقسيم النص إلى رموز مميزة باسم التقطيع إلى رموز مميزة.

بالنسبة إلى نماذج Gemini، يعادل الرمز المميز حوالي 4 أحرف. تعادل 100 رمز مميز حوالي 60 إلى 80 كلمة إنجليزية.

لكل نموذج عدد أقصى من الرموز المميزة يمكنه معالجتها في الطلب والرد. من خلال معرفة عدد الرموز المميزة في طلبك، يمكنك معرفة ما إذا كنت قد تجاوزت هذا الحدّ. بالإضافة إلى ذلك، يتم تحديد تكلفة الطلب جزئيًا من خلال عدد الرموز المميزة الخاصة بالمدخلات والمخرجات، لذا قد يكون من المفيد معرفة كيفية احتساب الرموز المميزة.

النماذج المتوافقة

  • gemini-3-pro-preview
  • gemini-3-flash-preview
  • gemini-3-pro-image-preview
  • gemini-2.5-pro
  • gemini-2.5-flash
  • gemini-2.5-flash-lite
  • gemini-2.0-flash-001 (والاسم المستعار gemini-2.0-flash الذي يتم تعديله تلقائيًا)
  • gemini-2.0-flash-lite-001 (والاسم المستعار الذي يتم تعديله تلقائيًا gemini-2.0-flash-lite)

خيارات احتساب الرموز المميزة

يتم تقسيم جميع المدخلات والمخرجات الخاصة بـ Gemini API إلى رموز مميزة، بما في ذلك النصوص وملفات الصور وغيرها من الوسائط غير النصية. في ما يلي خيارات احتساب الرموز المميزة:

تحقَّق من عدد الرموز المميزة في طلباتك فقط (قبل إرسالها إلى النموذج).
اتّصِل countTokens مع إدخال الطلب قبل إرساله إلى النموذج. تعرض هذه الدالة ما يلي:
  • total_tokens: عدد الرموز المميّزة للمدخلات فقط
تحقَّق من عدد الرموز المميزة لكل من طلباتك وردودك.
الوصول إلى السمة usageMetadata في عنصر الاستجابة ويشمل ذلك ما يلي:
  • prompt_token_count: عدد الرموز المميّزة في الإدخال فقط
  • candidates_token_count: عدد الرموز المميزة في الناتج فقط (لا يشمل الرموز المميزة الخاصة بالتفكير)
  • thoughts_token_count: عدد الرموز المميزة الخاصة بالتفكير المستخدَمة لإنشاء الرد
  • total_token_count: إجمالي عدد الرموز المميّزة لكلّ من الإدخال والإخراج (بما في ذلك أي رموز مميّزة للتفكير)

عند بث الناتج، لا تظهر السمة usageMetadata إلا في آخر جزء من البث. وهي nil للقطع الوسيطة.

تجدُر الإشارة إلى النقاط التالية بشأن الخيارات المذكورة أعلاه:

  • لن يتم احتساب عدد الصور المدخلة أو عدد الثواني في ملفات الفيديو أو الملفات الصوتية المدخلة. ومع ذلك، فإنّ عدد الرموز المميزة لكل من هذه الوسائط سيتناسب طرديًا مع هذه القيم.
  • يشمل عدد الرموز المميزة في الطلب الطلب (النص وأي ملفات إدخال) بالإضافة إلى أي تعليمات وأدوات خاصة بالنظام.
  • لا يتضمّن عدد الرموز المميزة للناتج أي رموز مميزة للتفكير، بل يتم توفيرها في حقل منفصل.
  • راجِع المعلومات الإضافية الخاصة بكل نوع من الطلبات لاحقًا في هذه الصفحة.
  • لا تتوافق نماذج Gemini Live API مع countTokens. بالإضافة إلى ذلك، Firebase AI Logic لا يتيح بعد استخدام السمة usageMetadata في الردود من نماذج Live API، ولكنّنا نعمل على توفيرها قريبًا.

أسعار هذه الخيارات

  • الاتصال countTokens: لا يتم تحصيل أي رسوم مقابل الاتصال countTokens (واجهة برمجة التطبيقات Count Tokens). الحدّ الأقصى للحصة المتاحة لواجهة برمجة التطبيقات Count Tokens API هو 3,000 طلب في الدقيقة.

  • استخدام السمة usageMetadata: يتم عرض هذه السمة دائمًا كجزء من الردّ ولا تتسبّب في أي تكلفة أو رسوم.

معلومات إضافية

في ما يلي بعض المعلومات الإضافية عند التعامل مع أنواع معيّنة من الطلبات.

احتساب الرموز المميزة للإدخال النصي

لا تتوفّر معلومات إضافية.

احتساب الرموز المميزة للمحادثات المتعددة الجولات

يُرجى ملاحظة ما يلي عند الاتصال بـ countTokens أثناء استخدام المحادثة:

  • إذا طلبت countTokens مع سجلّ المحادثات، سيتم عرض إجمالي عدد الرموز المميزة من كلا الدورين في المحادثة (total_tokens).
  • لمعرفة حجم الدور التالي في المحادثة، عليك إضافته إلى السجلّ عند طلب countTokens.

عدّ الرموز المميزة للإدخال المتعدد الوسائط

تجدُر الإشارة إلى النقاط التالية حول احتساب الرموز المميزة باستخدام الإدخال المتعدّد الوسائط:

  • يمكنك اختياريًا الاتصال بـ countTokens بشأن النص والملف بشكل منفصل.
  • بالنسبة إلى خيارَي احتساب الرموز المميزة، ستحصل على عدد الرموز المميزة نفسه سواء قدّمت الملف كبيانات مضمّنة أو باستخدام عنوان URL الخاص به.

ملفات إدخال الصور

يتم تحويل ملفات إدخال الصور إلى رموز مميزة استنادًا إلى أبعادها:

  • مدخلات الصور التي يقل كلا بُعدَيها عن 384 بكسل أو يساويهما: يتم احتساب 258 رمزًا مميزًا لكل صورة.
  • مدخلات الصور التي تكون أكبر في أحد البُعدَين أو كليهما: يتم اقتصاص كل صورة وتغيير حجمها حسب الحاجة إلى مربعات بحجم 768 × 768 بكسل، ثم يتم احتساب كل مربع على أنّه 258 رمزًا مميزًا.

ملفات إدخال الفيديو والصوت

يتم تحويل ملفات إدخال الفيديو والصوت إلى رموز مميزة بالمعدلات الثابتة التالية:

  • الفيديو: 263 رمزًا مميزًا في الثانية
  • الصوت: 32 رمزًا مميزًا في الثانية

ملفات إدخال المستندات (مثل ملفات PDF)

يتم التعامل مع ملفات PDF المدخلة على أنّها صور، لذا يتم تقسيم كل صفحة من ملف PDF إلى رموز مميزة بالطريقة نفسها التي يتم بها تقسيم الصور.