التعرّف على نماذج Gemini

تعد مجموعة طُرز Gemini متعددة الوسائط لأنها قادرة على معالجة المعلومات من أشكال متعددة، بما في ذلك الصور والفيديوهات والنصوص. على سبيل المثال، يمكنك إرسال صورة لطبق من الكعك إلى نموذج الجوزاء وتطلب منه تقديم وصفة لهذه الكعكات.

طلب الرد

أريد وصفة لهذه الكعكة.

صورة لعدة كعك برقائق شوكولاتة
**العناصر**
- 1 ج. (عودان) زبدة غير مملحة
- 3/4 ج - سكر حبيبات
- 3/4 ج. سكر بني معبّأ
- ملعقة صغيرة واحدة خلاصة الفانيليا
- بيضتان كبيرتان
- 2 1/4 درجة مئوية من الدقيق لجميع الأغراض
- ملعقة صغيرة من صودا الخبز
- ملعقة صغيرة من الملح
...

يمكنك التفاعل مع مجموعة طُرز Gemini باستخدام Gemini API التي تقدّمها Vertex AI على Google Cloud. بالنسبة إلى تطبيقات الويب والأجهزة الجوّالة، يمكنك استخدام حِزم تطوير البرامج (SDK) الخاصة بأداة Vertex AI for Firebase لطلب بيانات Gemini API والتفاعل مع نماذج Gemini مباشرةً من تطبيقك.

تقدّم هذه الصفحة المعلومات التالية حول طُرز Gemini:

  • مقارنة عالية المستوى لحالات الاستخدام لنماذج Gemini المختلفة، بما في ذلك أنواع إدخالها المتوافقة

  • مقارنة تفاصيل كل نموذج، على سبيل المثال، الحد الأقصى للرموز المميّزة للإدخال أو الحدّ الأقصى لطول الفيديو

  • وصف يوضّح كيفية إصدار نماذج Gemini، لا سيما الإصدارات الثابتة والمحدّثة تلقائيًا والمعاينة.

  • قوائم أسماء النماذج المتاحة لتضمينها في الرمز أثناء الإعداد.

  • قائمة باللغات المعتمَدة لطُرز Gemini.

الطرُز المتاحة

يمكنك استخدام أيّ من طُرز Gemini التالية مع Vertex AI for Firebase:

  • Gemini 1.5 Flash: نموذج متعدد الوسائط يتوافق مع أنواع الإدخال والإخراج نفسها مثل 1.5 Pro (بالإضافة إلى إجمالي عدد الرموز المميّزة)، ولكن تم تصميم برنامج Flash 1.5 خصيصًا للتطبيقات ذات الأحجام الضخمة والموفّرة من حيث التكلفة.

  • Gemini 1.5 Pro: نموذج متعدد الوسائط يتيح إضافة ملفات صور وصوت وفيديو وPDF في الطلبات النصية أو رسائل المحادثة للردّ على نص أو رمز. ويدعم أيضًا الفهم طويل السياق من خلال استخدام ما يصل إلى مليون رمز مميّز.

  • Gemini 1.0 Pro Vision: نموذج متعدد الوسائط تم تصميمه لمعالجة النصوص والصور والفيديوهات عند الردّ على نص أو رمز. لا يمكن استخدامه للمحادثة.

  • Gemini 1.0 Pro: نموذج مصمَّم للتعامل مع مهام اللغة الطبيعية والدردشة المتعددة الأدوار باستخدام النص والرموز البرمجية وإنشاء الرموز.

يمكنك الانتقال إلى أسماء النماذج لتضمينها في الرمز.

حالات الاستخدام لكل نموذج

Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
أنواع الإدخال
Text
الرمز
صورة
ملف PDF
فيديو (الإطارات فقط)
فيديو (الإطارات والصوت)
أجهزة الصوت
أنواع النتائج
Text
الرمز
حالات الاستخدام العامة
الطلبات المتعدّدة الوسائط
محادثات متعددة الأدوار

مزيد من المعلومات حول حالات استخدام نماذج Gemini في مستندات Google Cloud:

معلومات مفصّلة عن كل نموذج

بالنسبة إلى جميع طُرز Gemini، يعادل الرمز المميّز حوالي 4 أحرف. 100 رمز مميز عبارة عن حوالي 60-80 كلمة إنجليزية. يمكنك تحديد إجمالي عدد الرموز المميّزة في طلباتك باستخدام countTokens.

الموقع Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
إجمالي الحد للرمز المميز (الإدخال والمخرجات المختلطة) مليون رمز مميّز 16,384 رمزًا مميّزًا 32,760 رمزًا مميّزًا
الحدّ الأقصى للرموز المميّزة للإخراج 8,192 رمزًا مميّزًا 2,048 رمزًا مميّزًا 8,192 رمزًا مميّزًا
الحد الأقصى لعدد الصور لكل طلب 3,000 صورة 16 صورة لا ينطبق
الحد الأقصى لحجم الصورة بترميز base64 7 ميغابايت 7 ميغابايت لا ينطبق
الحد الأقصى لحجم ملف PDF 30 ميغابايت 30 ميغابايت لا ينطبق
الحد الأقصى لعدد ملفات الفيديو لكل طلب 10 ملفات فيديو ملف فيديو واحد لا ينطبق
الحد الأقصى لطول الفيديو (الإطارات فقط) 60 دقيقة من الفيديو دقيقتان لا ينطبق
الحد الأقصى لطول الفيديو (الإطارات والصوت) حوالي 45 دقيقة من الفيديو لا ينطبق لا ينطبق
الحد الأقصى لعدد الملفات الصوتية لكل طلب ملف صوتي واحد لا ينطبق لا ينطبق
الحدّ الأقصى لطول الصوت حوالي 8.4 ساعات من المحتوى الصوتي لا ينطبق لا ينطبق

يمكنك هنا العثور على معلومات أكثر تفصيلاً حول النماذج وملفات الإدخال:

إصدارات النماذج

تتوفّر طُرز Gemini في الإصدارات الثابتة والمحدّثة تلقائيًا والمعاينة.

  • تُعتبر الإصدارات الثابتة "متوفّرة بشكلٍ عام".

    • تحتوي الإصدارات الثابتة على أسماء نماذج مرفقة برقم إصدار محدّد مكوَّن من ثلاثة أرقام، على سبيل المثال gemini-1.0-pro-001.
  • تشير الإصدارات المحدَّثة تلقائيًا دائمًا إلى أحدث إصدار ثابت من هذا النموذج. وفي حال طرح إصدار ثابت جديد، يبدأ الإصدار المحدَّث تلقائيًا في الإشارة إلى ذلك الإصدار الثابت الجديد.

    • تحتوي الإصدارات التي يتم تعديلها تلقائيًا على أسماء نماذج بدون ملحقات، على سبيل المثال gemini-1.0-pro.
  • تحتوي إصدارات المعاينة على إمكانات جديدة وتُعتبر غير ثابتة. تجدر الإشارة إلى أنّ إصدارات المعاينة تشير دائمًا إلى أحدث إصدار من المعاينة من هذا النموذج، وفي حال طرح إصدار معاينة جديد، يبدأ أي إصدار معاينة حالي في الإشارة إلى إصدار المعاينة الجديد هذا تلقائيًا.

    • تحتوي نُسخ المعاينة على أسماء نماذج مرفقة مع -preview إلى جانب تاريخ الإصدار الأولي للنموذج (-MMDD)، على سبيل المثال gemini-1.5-pro-preview-0409 (تاريخ الإصدار: 9 نيسان/أبريل 2024).

يمكنك الاطّلاع على مزيد من المعلومات حول إصدارات نماذج Gemini المتوفّرة ومراحل نشاطها في مستندات Google Cloud.

أسماء الطُرز المتاحة

أسماء النماذج هي القيم الصريحة التي تدرجها في رمزك أثناء إعداد النموذج التوليدي (وهي خطوة مطلوبة لطلب واجهة Gemini API). للحصول على أمثلة تهيئة للغتك، يمكنك الاطّلاع على دليل البدء.

أسماء طُرز Gemini 1.5 Flash

اسم النموذج الوصف مرحلة إصدار المحتوى التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.5-flash-001 أحدث إصدار ثابت من Gemini 1.5 Flash مدى التوفّر للجمهور العام 2024-05-24 قبل 24 أيار (مايو) 2025
نسخة يتم تحديثها تلقائيًا
gemini-1.5-flash يشير إلى أحدث إصدار ثابت من Flash 1.5
(حاليًا gemini-1.5-flash-001)
مدى التوفّر للجمهور العام 2024-05-24 ---
معاينة النُسخ
gemini-1.5-flash-preview-0514 أحدث إصدار لمعاينة برنامج Gemini 1.5 Flash الميزات التجريبية المتاحة للجميع 2024-05-14 2024-06-24

أسماء طُرز Gemini 1.5 Pro

اسم النموذج الوصف مرحلة إصدار المحتوى التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.5-pro-001 أحدث إصدار ثابت من Gemini 1.5 Pro مدى التوفّر للجمهور العام 2024-05-24 قبل 24 أيار (مايو) 2025
نسخة يتم تحديثها تلقائيًا
gemini-1.5-pro يشير إلى أحدث إصدار ثابت من 1.5 Pro
(حاليًا gemini-1.5-pro-001)
مدى التوفّر للجمهور العام 2024-05-24 ---
معاينة النُسخ
gemini-1.5-pro-preview-0514 أحدث إصدار لمعاينة الإصدار Gemini 1.5 Pro الميزات التجريبية المتاحة للجميع 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 تشير إلى gemini-1.5-pro-preview-0514
(وهو إصدار أحدث إصدار للمعاينة)
الميزات التجريبية المتاحة للجميع 2024-04-09 2024-06-14

أسماء نماذج Gemini 1.0 Pro Vision

اسم النموذج الوصف مرحلة إصدار المحتوى التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.0-pro-vision-001 أحدث إصدار ثابت من Gemini 1.0 Pro Vision مدى التوفّر للجمهور العام 2024-02-15 قبل 15 كانون الأول (ديسمبر) 2025
نسخة يتم تحديثها تلقائيًا
gemini-1.0-pro-vision يشير إلى أحدث إصدار ثابت من 1.5 Pro Vision
(حاليًا gemini-1.5-pro-vision-001)
مدى التوفّر للجمهور العام 2024-01-04 ---

أسماء طُرز Gemini 1.0 Pro

اسم النموذج الوصف مرحلة إصدار المحتوى التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.0-pro-002 أحدث إصدار ثابت من Gemini 1.0 Pro مدى التوفّر للجمهور العام 2024-04-09 قبل 2025-04-09
gemini-1.0-pro-001 الإصدار الثابت من Gemini 1.0 Pro مدى التوفّر للجمهور العام 2024-02-15 قبل 15 كانون الأول (ديسمبر) 2025
نسخة يتم تحديثها تلقائيًا
gemini-1.0-pro يشير إلى أحدث إصدار ثابت من 1.0 Pro
(حاليًا gemini-1.0-pro-002)
مدى التوفّر للجمهور العام 2024-02-15 ---

اللغات المُعتمَدة

تتوافق طُرز Gemini مع اللغات التالية:

العربية (ar)، البنغالية (bn)، البلغارية (bn)، البلغارية (bg)، الصينية المبسّطة والتقليدية (zh)، الكرواتية (hr)، التشيكية (cs)، الدانمركية (da)، الهولندية (nl)، الإنجليزية (en)، الإستونية (et)، الفنلندية (fi)، الفرنسية (fr)، الألمانية (de)، البولندية، العبرية، العبرية، العبرية، العبرية، الهندية (hu)، الهندية (المجرية)،

الخطوات اللاحقة

تجربة إمكانات واجهة Gemini API