عند طلب واجهة برمجة تطبيقات Vertex AI Gemini من تطبيقك باستخدام حزمة تطوير البرامج (SDK) الخاصة بالذكاء الاصطناعي من Vertex AI for Firebase، يمكنك أن تطلب من نموذج Gemini إنشاء نص استنادًا إلى إدخال متعدد الوسائط. يمكن أن تتضمن الطلبات المتعددة الوسائط عدة وسائط (أو أنواع إدخال)، مثل النص مع الصور وملفات PDF والفيديو والصوت.
بالنسبة إلى الأجزاء غير النصية في الإدخال (مثل ملفات الوسائط)، ستحتاج إلى استخدام أنواع ملفات متوافقة، وتحديد نوع MIME متوافق، والتأكّد من أنّ الملفات والطلبات المتعددة الوسائط تستوفي المتطلبات وتتّبع أفضل الممارسات.
تختلف ملفات الإدخال المتوافقة حسب الطراز، ويمكن أن تتضمن الصور وملفات PDF والفيديو والملفات الصوتية.
- يُرجى العِلم أنّ إدخال الفيديو المتوافق يختلف أيضًا حسب النموذج ويمكن أن يتضمّن إطارات فقط أو إطارات تتضمّن صوتًا.
المتطلبات وأفضل الممارسات المتعلقة بملفات الإدخال والطلبات المتعددة الوسائط:
في مزيد من المعلومات حول نماذج Gemini، يمكنك العثور على ملخّص سريع لمتطلبات الملفات المتوافقة حسب النموذج (مثل الحدّ الأقصى لعدد الملفات والحدّ الأقصى لحجم الملف).
ضمن مستندات Google Cloud، يمكنك الاطّلاع على معلومات مفصَّلة حول المتطلبات وأفضل الممارسات لملفات الإدخال والطلبات المتعددة الوسائط (على سبيل المثال، أنواع MIME المتوافقة والحالات التي يجب فيها تقديم ملف الإدخال في الطلب).
متطلبات خاصة بحِزم تطوير البرامج (SDK) الخاصة بحزمة Vertex AI for Firebase
بالنسبة إلى حِزم تطوير البرامج (SDK) الخاصة بحزمة Vertex AI for Firebase، يكون الحدّ الأقصى لحجم الطلب 20 ميغابايت. إذا كان الطلب كبيرًا جدًا، ستحصل على خطأ HTTP 413.
إذا كان حجم الملف سيؤدي إلى تجاوز إجمالي حجم الطلب 20 ميغابايت، استخدِم عنوان URL الخاص بخدمة Cloud Storage for Firebase لتضمين الملف في طلبك المتعدّد الوسائط.
إذا كان الملف صغيرًا، فيمكنك غالبًا تمريره مباشرةً كبيانات مضمنة. يُرجى العِلم أنّ الملف المقدَّم كبيانات مضمّنة يتم ترميزه إلى Base64 أثناء النقل، ما يزيد من حجم الطلب. للحصول على أمثلة توضّح كيفية تضمين الملفات كبيانات مضمَّنة، يُرجى الاطّلاع على إنشاء نص من طلبات متعددة الوسائط باستخدام Gemini API.