تعد مجموعة طُرز Gemini متعددة الوسائط لأنها قادرة على معالجة المعلومات من أشكال متعددة، بما في ذلك الصور والفيديوهات والنصوص. على سبيل المثال، يمكنك إرسال صورة لطبق من الكعك إلى نموذج الجوزاء وتطلب منه تقديم وصفة لهذه الكعكات.
طلب | الرد |
أريد وصفة لهذه الكعكة. ![]() |
**العناصر** - 1 ج. (عودان) زبدة غير مملحة - 3/4 ج - سكر حبيبات - 3/4 ج. سكر بني معبّأ - ملعقة صغيرة واحدة خلاصة الفانيليا - بيضتان كبيرتان - 2 1/4 درجة مئوية من الدقيق لجميع الأغراض - ملعقة صغيرة من صودا الخبز - ملعقة صغيرة من الملح ... |
يمكنك التفاعل مع مجموعة طُرز Gemini باستخدام Gemini API التي تقدّمها Vertex AI على Google Cloud. بالنسبة إلى تطبيقات الويب والأجهزة الجوّالة، يمكنك استخدام حِزم تطوير البرامج (SDK) الخاصة بأداة Vertex AI for Firebase لطلب بيانات Gemini API والتفاعل مع نماذج Gemini مباشرةً من تطبيقك.
تقدّم هذه الصفحة المعلومات التالية حول طُرز Gemini:
مقارنة عالية المستوى لحالات الاستخدام لنماذج Gemini المختلفة، بما في ذلك أنواع إدخالها المتوافقة
مقارنة تفاصيل كل نموذج، على سبيل المثال، الحد الأقصى للرموز المميّزة للإدخال أو الحدّ الأقصى لطول الفيديو
وصف يوضّح كيفية إصدار نماذج Gemini، لا سيما الإصدارات الثابتة والمحدّثة تلقائيًا والمعاينة.
قوائم أسماء النماذج المتاحة لتضمينها في الرمز أثناء الإعداد.
قائمة باللغات المعتمَدة لطُرز Gemini.
الطرُز المتاحة
يمكنك استخدام أيّ من طُرز Gemini التالية مع Vertex AI for Firebase:
Gemini 1.5 Flash: نموذج متعدد الوسائط يتوافق مع أنواع الإدخال والإخراج نفسها مثل 1.5 Pro (بالإضافة إلى إجمالي عدد الرموز المميّزة)، ولكن تم تصميم برنامج Flash 1.5 خصيصًا للتطبيقات ذات الأحجام الضخمة والموفّرة من حيث التكلفة.
Gemini 1.5 Pro: نموذج متعدد الوسائط يتيح إضافة ملفات صور وصوت وفيديو وPDF في الطلبات النصية أو رسائل المحادثة للردّ على نص أو رمز. ويدعم أيضًا الفهم طويل السياق من خلال استخدام ما يصل إلى مليون رمز مميّز.
Gemini 1.0 Pro Vision: نموذج متعدد الوسائط تم تصميمه لمعالجة النصوص والصور والفيديوهات عند الردّ على نص أو رمز. لا يمكن استخدامه للمحادثة.
Gemini 1.0 Pro: نموذج مصمَّم للتعامل مع مهام اللغة الطبيعية والدردشة المتعددة الأدوار باستخدام النص والرموز البرمجية وإنشاء الرموز.
يمكنك الانتقال إلى أسماء النماذج لتضمينها في الرمز.
حالات الاستخدام لكل نموذج
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|
أنواع الإدخال | |||
Text | |||
الرمز | |||
صورة | |||
ملف PDF | |||
فيديو (الإطارات فقط) | |||
فيديو (الإطارات والصوت) | |||
أجهزة الصوت | |||
أنواع النتائج | |||
Text | |||
الرمز | |||
حالات الاستخدام العامة | |||
الطلبات المتعدّدة الوسائط | |||
محادثات متعددة الأدوار |
مزيد من المعلومات حول حالات استخدام نماذج Gemini في مستندات Google Cloud:
- حالات استخدام Flash 1.5 من Gemini
- حالات استخدام Gemini 1.5 Pro
- حالات استخدام Gemini 1.0 Pro Vision
- حالات استخدام Gemini 1.0 Pro
معلومات مفصّلة عن كل نموذج
بالنسبة إلى جميع طُرز Gemini، يعادل الرمز المميّز حوالي 4 أحرف. 100 رمز مميز عبارة عن
حوالي 60-80 كلمة إنجليزية. يمكنك تحديد إجمالي عدد الرموز المميّزة في طلباتك باستخدام countTokens
.
الموقع |
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|
إجمالي الحد للرمز المميز (الإدخال والمخرجات المختلطة) | مليون رمز مميّز | 16,384 رمزًا مميّزًا | 32,760 رمزًا مميّزًا |
الحدّ الأقصى للرموز المميّزة للإخراج | 8,192 رمزًا مميّزًا | 2,048 رمزًا مميّزًا | 8,192 رمزًا مميّزًا |
الحد الأقصى لعدد الصور لكل طلب | 3,000 صورة | 16 صورة | لا ينطبق |
الحد الأقصى لحجم الصورة بترميز base64 | 7 ميغابايت | 7 ميغابايت | لا ينطبق |
الحد الأقصى لحجم ملف PDF | 30 ميغابايت | 30 ميغابايت | لا ينطبق |
الحد الأقصى لعدد ملفات الفيديو لكل طلب | 10 ملفات فيديو | ملف فيديو واحد | لا ينطبق |
الحد الأقصى لطول الفيديو (الإطارات فقط) | 60 دقيقة من الفيديو | دقيقتان | لا ينطبق |
الحد الأقصى لطول الفيديو (الإطارات والصوت) | حوالي 45 دقيقة من الفيديو | لا ينطبق | لا ينطبق |
الحد الأقصى لعدد الملفات الصوتية لكل طلب | ملف صوتي واحد | لا ينطبق | لا ينطبق |
الحدّ الأقصى لطول الصوت | حوالي 8.4 ساعات من المحتوى الصوتي | لا ينطبق | لا ينطبق |
يمكنك هنا العثور على معلومات أكثر تفصيلاً حول النماذج وملفات الإدخال:
تعرّف على الاختلافات بين النماذج متعددة الوسائط في مستندات Google Cloud.
تعرَّف على أنواع الملفات المتوافقة وكيفية تحديد نوع MIME وكيفية التأكّد من أنّ ملفاتك والطلبات المتعدّدة الوسائط تستوفي المتطلبات واتّبِع أفضل الممارسات الواردة في ملفات الإدخال والمتطلبات المتوافقة مع واجهة برمجة تطبيقات Vertex AI Gemini.
إصدارات النماذج
تتوفّر طُرز Gemini في الإصدارات الثابتة والمحدّثة تلقائيًا والمعاينة.
تُعتبر الإصدارات الثابتة "متوفّرة بشكلٍ عام".
- تحتوي الإصدارات الثابتة على أسماء نماذج مرفقة برقم إصدار محدّد مكوَّن من ثلاثة أرقام، على سبيل المثال
.gemini-1.0-pro-001
- تحتوي الإصدارات الثابتة على أسماء نماذج مرفقة برقم إصدار محدّد مكوَّن من ثلاثة أرقام، على سبيل المثال
تشير الإصدارات المحدَّثة تلقائيًا دائمًا إلى أحدث إصدار ثابت من هذا النموذج. وفي حال طرح إصدار ثابت جديد، يبدأ الإصدار المحدَّث تلقائيًا في الإشارة إلى ذلك الإصدار الثابت الجديد.
- تحتوي الإصدارات التي يتم تعديلها تلقائيًا على أسماء نماذج بدون
ملحقات، على سبيل المثال
.gemini-1.0-pro
- تحتوي الإصدارات التي يتم تعديلها تلقائيًا على أسماء نماذج بدون
ملحقات، على سبيل المثال
تحتوي إصدارات المعاينة على إمكانات جديدة وتُعتبر غير ثابتة. تجدر الإشارة إلى أنّ إصدارات المعاينة تشير دائمًا إلى أحدث إصدار من المعاينة من هذا النموذج، وفي حال طرح إصدار معاينة جديد، يبدأ أي إصدار معاينة حالي في الإشارة إلى إصدار المعاينة الجديد هذا تلقائيًا.
- تحتوي نُسخ المعاينة على أسماء نماذج مرفقة مع
إلى جانب تاريخ الإصدار الأولي للنموذج (-preview
)، على سبيل المثال-MMDD
(تاريخ الإصدار: 9 نيسان/أبريل 2024).gemini-1.5-pro-preview-0409
- تحتوي نُسخ المعاينة على أسماء نماذج مرفقة مع
يمكنك الاطّلاع على مزيد من المعلومات حول إصدارات نماذج Gemini المتوفّرة ومراحل نشاطها في مستندات Google Cloud.
أسماء الطُرز المتاحة
أسماء النماذج هي القيم الصريحة التي تدرجها في رمزك أثناء إعداد النموذج التوليدي (وهي خطوة مطلوبة لطلب واجهة Gemini API). للحصول على أمثلة تهيئة للغتك، يمكنك الاطّلاع على دليل البدء.
أسماء طُرز Gemini 1.5 Flash
اسم النموذج | الوصف | مرحلة إصدار المحتوى | التاريخ الأولي للإصدار | تاريخ الإيقاف |
---|---|---|---|---|
الإصدارات الثابتة | ||||
gemini-1.5-flash-001 |
أحدث إصدار ثابت من Gemini 1.5 Flash | مدى التوفّر للجمهور العام | 2024-05-24 | قبل 24 أيار (مايو) 2025 |
نسخة يتم تحديثها تلقائيًا | ||||
gemini-1.5-flash |
يشير إلى أحدث إصدار ثابت من Flash 1.5 (حاليًا gemini-1.5-flash-001 |
مدى التوفّر للجمهور العام | 2024-05-24 | --- |
معاينة النُسخ | ||||
gemini-1.5-flash-preview-0514 |
أحدث إصدار لمعاينة برنامج Gemini 1.5 Flash | الميزات التجريبية المتاحة للجميع | 2024-05-14 | 2024-06-24 |
أسماء طُرز Gemini 1.5 Pro
اسم النموذج | الوصف | مرحلة إصدار المحتوى | التاريخ الأولي للإصدار | تاريخ الإيقاف |
---|---|---|---|---|
الإصدارات الثابتة | ||||
gemini-1.5-pro-001 |
أحدث إصدار ثابت من Gemini 1.5 Pro | مدى التوفّر للجمهور العام | 2024-05-24 | قبل 24 أيار (مايو) 2025 |
نسخة يتم تحديثها تلقائيًا | ||||
gemini-1.5-pro |
يشير إلى أحدث إصدار ثابت من 1.5 Pro (حاليًا gemini-1.5-pro-001 |
مدى التوفّر للجمهور العام | 2024-05-24 | --- |
معاينة النُسخ | ||||
gemini-1.5-pro-preview-0514 |
أحدث إصدار لمعاينة الإصدار Gemini 1.5 Pro | الميزات التجريبية المتاحة للجميع | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
تشير إلى gemini-1.5-pro-preview-0514 (وهو إصدار أحدث إصدار للمعاينة) |
الميزات التجريبية المتاحة للجميع | 2024-04-09 | 2024-06-14 |
أسماء نماذج Gemini 1.0 Pro Vision
اسم النموذج | الوصف | مرحلة إصدار المحتوى | التاريخ الأولي للإصدار | تاريخ الإيقاف |
---|---|---|---|---|
الإصدارات الثابتة | ||||
gemini-1.0-pro-vision-001 |
أحدث إصدار ثابت من Gemini 1.0 Pro Vision | مدى التوفّر للجمهور العام | 2024-02-15 | قبل 15 كانون الأول (ديسمبر) 2025 |
نسخة يتم تحديثها تلقائيًا | ||||
gemini-1.0-pro-vision |
يشير إلى أحدث إصدار ثابت من 1.5 Pro Vision (حاليًا gemini-1.5-pro-vision-001 |
مدى التوفّر للجمهور العام | 2024-01-04 | --- |
أسماء طُرز Gemini 1.0 Pro
اسم النموذج | الوصف | مرحلة إصدار المحتوى | التاريخ الأولي للإصدار | تاريخ الإيقاف |
---|---|---|---|---|
الإصدارات الثابتة | ||||
gemini-1.0-pro-002 |
أحدث إصدار ثابت من Gemini 1.0 Pro | مدى التوفّر للجمهور العام | 2024-04-09 | قبل 2025-04-09 |
gemini-1.0-pro-001 |
الإصدار الثابت من Gemini 1.0 Pro | مدى التوفّر للجمهور العام | 2024-02-15 | قبل 15 كانون الأول (ديسمبر) 2025 |
نسخة يتم تحديثها تلقائيًا | ||||
gemini-1.0-pro |
يشير إلى أحدث إصدار ثابت من 1.0 Pro (حاليًا gemini-1.0-pro-002 |
مدى التوفّر للجمهور العام | 2024-02-15 | --- |
اللغات المُعتمَدة
تتوافق طُرز Gemini مع اللغات التالية:
العربية (ar)، البنغالية (bn)، البلغارية (bn)، البلغارية (bg)، الصينية المبسّطة والتقليدية (zh)، الكرواتية (hr)، التشيكية (cs)، الدانمركية (da)، الهولندية (nl)، الإنجليزية (en)، الإستونية (et)، الفنلندية (fi)، الفرنسية (fr)، الألمانية (de)، البولندية، العبرية، العبرية، العبرية، العبرية، الهندية (hu)، الهندية (المجرية)،
الخطوات اللاحقة
تجربة إمكانات واجهة Gemini API
- أنشِئ محادثات متعددة الأدوار (المحادثة).
- إنشاء نص من الطلبات النصية فقط
- إنشاء نص من طلبات متعددة الوسائط (بما في ذلك النصوص والصور وملفات PDF والفيديوهات والمحتوى الصوتي)
- استخدِم ميزة استدعاء الوظائف لربط النماذج التوليدية بالأنظمة والمعلومات الخارجية.