مزيد من المعلومات عن نماذج Gemini

تُعدّ مجموعة نماذج Gemini متعددة الوسائط لأنّها قادرة على معالجة المعلومات من وسائط متعددة، بما في ذلك الصور والفيديوهات والنصوص. على سبيل المثال، يمكنك إرسال صورة طبق من البسكويت إلى أحد نماذج Gemini وطلب الحصول على وصفة لإعداد هذا البسكويت.

الطلب الاستجابة

أريد الحصول على وصفة لهذه البسكويتات.

صورة لعدة قطع من الكوكيز برقائق الشوكولاتة
**المكوّنات**
- 1 ملعقة كبيرة (علبتان) زبدة غير مملحة، مخفّفة
- 3/4 كوب سكر محبّب
- 3/4 كوب سكر بني ممتلئة
- ملعقة صغيرة خلاصة الفانيليا
- بيضتان كبيرتان
- 2 1/4 كوب دقيق لجميع الأغراض
- ملعقة صغيرة من بيكربونات الصودا
- ملعقة صغيرة من الملح
...

يمكنك التفاعل مع مجموعة نماذج Gemini باستخدام Gemini API المقدَّمة من Vertex AI على Google Cloud. بالنسبة إلى تطبيقات الويب والتطبيقات المتوافقة مع الأجهزة الجوّالة، يمكنك استخدام Vertex AI in Firebase حِزم تطوير البرامج (SDK) لاستدعاء واجهة برمجة التطبيقات Gemini API والتفاعل مع نماذج Gemini مباشرةً من تطبيقك.

تقدّم هذه الصفحة المعلومات التالية عن نماذج Gemini:

النماذج المتاحة

يمكنك استخدام أيّ من نماذج Gemini التالية مع Vertex AI in Firebase:

  • Gemini 1.5 Flash
    نموذج متعدد الوسائط يتيح استخدام أنواع الإدخال والإخراج نفسها في الإصدار 1.5 Pro، ولكن مع فهم السياق الطويل الذي يتضمّن مليون رمز مميّز. تم تصميم نموذج Gemini 1.5 Flash خصيصًا للتطبيقات التي تتطلب معالجة كميات كبيرة من البيانات بتكلفة منخفضة.

  • Gemini 1.5 Pro
    نموذج متعدد الوسائط يتيح إضافة صور وملفات صوتية وفيديو وملفات PDF في طلبات النص أو المحادثة للحصول على ردّ نصي أو رمزي. ويدعم هذا النموذج أيضًا فهم السياق الطويل باستخدام مليونَي رمز.

  • Gemini 1.0 Pro Vision
    نموذج متعدد الوسائط مصمّم للتعامل مع النصوص بالإضافة إلى الصور والفيديوهات من أجل تقديم ردود نصية أو رمزية. لا يمكن استخدامها للمحادثة.

  • Gemini 1.0 Pro
    تم تصميم هذا النموذج للتعامل مع مهام اللغة الطبيعية ومحادثات متعددة المقاطع باستخدام النصوص والرموز البرمجية وإنشاء الرموز البرمجية.

الانتقال إلى أسماء الطُرز لتضمينها في الرمز

حالات الاستخدام والإمكانات لكل نموذج

يمتلك كل طراز من طُرز Gemini إمكانات مختلفة لاستخدامه في حالات مختلفة. يمكنك الاطّلاع على المزيد من المعلومات في مستندات "Google Cloud" حول كل نموذج من نماذج Gemini.

الإدخالات والمخرجات المتوافقة لكل نموذج

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
أنواع الإدخال
Text
الرمز
صورة
ملف PDF
الفيديو (الإطارات فقط)
الفيديو (الإطارات والصوت)
الصوت
أنواع النتائج
Text
إخراج منظَّم (مثل JSON) باستخدام مخطّط الاستجابة
الرمز

للاطّلاع على أنواع الملفات المتوافقة، يُرجى الاطّلاع على مقالة ملفات الإدخال المتوافقة ومتطلبات Vertex AI Gemini API.

الإمكانات والميزات العامة المتاحة لكل طراز

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
إنشاء النص من خلال إدخال النص فقط
إنشاء نص من إدخال متعدد الوسائط
الإخراج المنظَّم (مثل JSON) باستخدام مخطّط الاستجابة
المحادثة المتعدّدة المقاطع
استدعاء الدوالّ
استدعاء الدوالّ الأساسية
استدعاء الدوالّ بشكل موازٍ
وضع استدعاء الدوال
احتساب الرموز والحروف التي يتم تحصيل رسومها
تعليمات النظام

معلومات تفصيلية حول كل نموذج

الموقع Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
الحدّ الأقصى لعدد الرموز المميّزة (إدخال وإخراج مجمّعان) * 1,048,576 رمزًا مميزًا 2,097,152 رمزًا مميّزًا 16,384 رمزًا مميزًا 32,760 رمزًا مميّزًا
الحد الأقصى لعدد الرموز المميّزة للإخراج * 8,192 رمزًا مميّزًا 8,192 رمزًا مميّزًا 2,048 رمزًا مميّزًا 8,192 رمزًا مميزًا
الحد الأقصى لعدد الصور لكل طلب 3,000 صورة 3,000 صورة 16 صورة لا ينطبق
الحد الأقصى لحجم الصورة بترميز base64 ‫7 ميغابايت ‫7 ميغابايت ‫7 ميغابايت لا ينطبق
الحد الأقصى لحجم ملف PDF 30 ميغابايت 30 ميغابايت 30 ميغابايت لا ينطبق
الحد الأقصى لعدد ملفات الفيديو لكل طلب 10 ملفات فيديو 10 ملفات فيديو ملف فيديو واحد لا ينطبق
الحد الأقصى لمدة الفيديو (الإطارات فقط) حوالي 60 دقيقة فيديو حوالي 60 دقيقة من الفيديو دقيقتان لا ينطبق
الحد الأقصى لمدة الفيديو (اللقطات والصوت) حوالي 45 دقيقة من الفيديو حوالي 45 دقيقة من الفيديو لا ينطبق لا ينطبق
الحد الأقصى لعدد الملفات الصوتية في كل طلب ملف صوتي واحد ملف صوتي واحد لا ينطبق لا ينطبق
الحد الأقصى لمدة الملف الصوتي حوالي 8.4 ساعة من الصوت حوالي 8.4 ساعة من الصوت لا ينطبق لا ينطبق

* في جميع نماذج Gemini، يعادل الرمز المميّز 4 أحرف تقريبًا، وبالتالي، فإنّ 100 رمز مميّز تقريبًا تتراوح بين 60 و80 كلمة باللغة الإنجليزية. يمكنك تحديد إجمالي عدد الرموز المميّزة في طلباتك باستخدام السمة countTokens.

تعرَّف على أنواع الملفات المتوافقة وكيفية تحديد نوع MIME وكيفية التأكّد من أنّ ملفاتك وطلباتك المتعدّدة الوسائط تستوفي المتطلبات وتتّبع أفضل الممارسات في ملفّات الإدخال المتوافقة ومتطلبات Vertex AI Gemini API.

تحديد إصدارات النماذج

تتوفّر نماذج Gemini في إصدارات ثابتة ويتم تحديثها تلقائيًا وإصدارات معاينة.

  • تعتبر الإصدارات الثابتة متوفرة للجمهور العام.

    • تحتوي الإصدارات الثابتة على أسماء طُرز مُلحقة بأحد أرقام الإصدار المحدّدة المكونة من ثلاثة أرقام، على سبيل المثال gemini-1.5-pro-002.
  • تشير الإصدارات التي يتم تحديثها تلقائيًا دائمًا إلى أحدث إصدار ثابت من هذا النموذج. وفي حال طرح إصدار ثابت جديد، سيبدأ الإصدار الذي يتم تحديثه تلقائيًا بالإشارة تلقائيًا إلى هذا الإصدار الثابت الجديد.

    • تحتوي الإصدارات التي يتم تحديثها تلقائيًا على أسماء طُرز بدون لاحقة، على سبيل المثال gemini-1.5-pro.
  • تتميز إصدارات المعاينة بإمكانيات جديدة ولا تُعتبر غير ثابتة. يُرجى العِلم أنّ إصدارات المعاينة تشير دائمًا إلى أحدث إصدار من المعاينة من هذا النموذج. في حال طرح إصدار معاينة جديد، سيبدأ تلقائيًا أي إصدار معاينة حالي في الإشارة إلى إصدار المعاينة الجديد.

    • تتضمّن النُسخ التجريبية أسماء النماذج مع علامتَي -preview وتاريخ الإصدار الأولي للنموذج (-MMDD)، على سبيل المثال: gemini-1.5-pro-preview-0409 (تم إصداره في 9 نيسان (أبريل) 2024).

يمكنك الاطّلاع على مزيد من المعلومات حول إصدارات نماذج Gemini المتاحة ومراحل نشاطها في مستندات Google Cloud.

أسماء الطُرز المتاحة

أسماء النماذج هي القيم الصريحة التي تُدرِجها في الرمز البرمجي أثناء تهيئة النموذج التوليدي (وهي خطوة مطلوبة لاستدعاء Gemini API). للحصول على أمثلة على عملية الإعداد للغة التي تستخدمها، اطّلِع على دليل البدء.

أسماء نماذج Gemini 1.5 Flash

اسم الطراز الوصف مرحلة الإصدار التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.5-flash-002 أحدث إصدار ثابت من نموذج Gemini 1.5 Flash مرحلة التوفّر للجمهور العام 2024-09-24 لا يجوز أن يكون تاريخ الإصدار قبل ‎24-09-2025
gemini-1.5-flash-001 الإصدار الأولي الثابت من نموذج Gemini 1.5 Flash مرحلة التوفّر للجمهور العام 2024-05-24 لا يجوز أن يكون تاريخ الإصدار قبل ‎24‏/05‏/2025.
الإصدار الذي يتم تحديثه تلقائيًا
gemini-1.5-flash تشير إلى gemini-1.5-flash-001

للوصول إلى gemini-1.5-flash-002، استخدِم اسم الإصدار الثابت الواضح بدلاً من الإصدار الذي يتم تحديثه تلقائيًا.
مرحلة التوفّر للجمهور العام 2024-05-24 ---

أسماء نماذج Gemini 1.5 Pro

اسم الطراز الوصف مرحلة الإصدار التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.5-pro-002 أحدث إصدار ثابت من Gemini 1.5 Pro مدى التوفّر للجمهور العام 2024-09-24 لا يجوز أن يكون تاريخ الإصدار قبل ‎24-09-2025
gemini-1.5-pro-001 الإصدار الأولي الثابت من Gemini 1.5 Pro مرحلة التوفّر للجمهور العام 2024-05-24 لا يجوز أن يكون تاريخ الإصدار قبل ‎24‏/05‏/2025.
الإصدار الذي يتم تحديثه تلقائيًا
gemini-1.5-pro يشير إلى gemini-1.5-pro-001

للوصول إلى gemini-1.5-pro-002، استخدِم اسم النموذج الثابت والصريح بدلاً من الإصدار المحدّث تلقائيًا.
مرحلة التوفّر للجمهور العام 2024-05-24 ---

أسماء طُرز Gemini 1.0 Pro Vision

اسم النموذج الوصف مرحلة الإصدار التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.0-pro-vision-001 أحدث إصدار ثابت من Gemini 1.0 Pro Vision مرحلة التوفّر للجمهور العام 2024-02-15 قبل 15/02/2025
الإصدار الذي يتم تحديثه تلقائيًا
gemini-1.0-pro-vision يشير إلى أحدث إصدار ثابت من الإصدار 1.5 من Pro Vision
(الإصدار الحالي هو gemini-1.5-pro-vision-001)
مرحلة التوفّر للجمهور العام 2024-01-04 ---

أسماء طُرز Gemini 1.0 Pro

اسم النموذج الوصف مرحلة الإصدار التاريخ الأولي للإصدار تاريخ الإيقاف
الإصدارات الثابتة
gemini-1.0-pro-002 أحدث إصدار ثابت من Gemini 1.0 Pro مرحلة التوفّر للجمهور العام 2024-04-09 ليس قبل تاريخ 2025/4/09
gemini-1.0-pro-001 إصدار ثابت من Gemini 1.0 Pro مرحلة التوفّر للجمهور العام 2024-02-15 لا يجوز أن يكون تاريخ الإصدار قبل ‎15‏ شباط (فبراير) 2025.
الإصدار الذي يتم تحديثه تلقائيًا
gemini-1.0-pro يشير إلى أحدث إصدار ثابت من الإصدار 1.0 Pro
(الإصدار الحالي هو gemini-1.0-pro-002)
مرحلة التوفّر للجمهور العام 2024-02-15 ---

اللغات المتاحة

  • بإمكان جميع نماذج Gemini فهم الردود والردّ عليها باللغات التالية:

    العربية (ar)، البنغالية (bn)، البلغارية (bg)، الصينية المبسّطة والتقليدية (zh)، الكرواتية (hr)، التشيكية (cs)، الدانمركية (da)، الهولندية (nl)، الإنجليزية (en)، الإستونية (et)، الفنلندية (fi)، الفرنسية (fr)، الألمانية (de)، اليونانية (el)، العبرية (iw)، الهندية (hi)، المجرية (hu)، الإندونيسية (id)، الإيطالية (it)، اليابانية (ja)، الكورية (ko)، اللاتفية (lv)، اللتوانية (lt)، النرويجية (no)، البولندية (pl)، البرتغالية (pt)، الرومانية (ro)، الروسية (ru)، الصربية (sr)، السلوفاكية (sk)، السلوفينية (sl)، الإسبانية (es)، السواحيلية (sw)، السويدية (sv)، التايلاندية (th)، التركية (tr)، الأوكرانية (uk)، الفيتنامية (vi)

  • يمكن لنموذجَي Flash 1.5 Pro وGemini 1.5 فهم المحتوى والردّ عليهما باللغات الإضافية التالية:

    أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة أو اللغة

الخطوات التالية

تجربة إمكانات Gemini API