ملفات الإدخال المتوافقة والمتطلبات في Vertex AI Gemini API

عند طلب واجهة برمجة تطبيقات Vertex AI Gemini من تطبيقك باستخدام حزمة تطوير برامج Vertex AI for Firebase: يمكنك أن تطلب من نموذج Gemini إنشاء نص استنادًا إلى إدخال متعدد الوسائط. يمكن أن تتضمّن الطلبات المتعددة الوسائط عدة وسائط. (أو أنواع الإدخال)، مثل النص مع الصور وملفات PDF والفيديو والصوت.

بالنسبة للأجزاء غير النصية من الإدخال (مثل ملفات الوسائط)، تحتاج إلى استخدام الملفات المتوافقة، وتحديد نوع MIME متوافق والتأكد من وتتطلب الملفات والطلبات متعددة الوسائط استيفاء المتطلبات واتّباع أفضل الممارسات.

  • تختلف ملفات الإدخال المدعومة حسب الطراز، ويمكن أن تتضمن الصور وملفات PDF ومقاطع الفيديو الصوت.

    • لاحظ أن إدخال الفيديو المتوافق يختلف أيضًا حسب الطراز ويمكن أن يشمل الإطارات فقط أو الإطارات التي تتضمّن صوتًا
  • المتطلبات وأفضل الممارسات المتعلقة بملفات الإدخال والطلبات المتعددة الوسائط:

    • ضِمن مزيد من المعلومات عن نماذج Gemini يمكنك العثور على ملخّص سريع لمتطلبات الملفات المتوافقة استنادًا إلى على النموذج (مثل الحد الأقصى لعدد الملفات والحد الأقصى لحجم الملف).

    • في مستندات Google Cloud، يمكنك التعرّف على معلومات مفصّلة بشأن المتطلبات و أفضل الممارسات لملفات الإدخال والطلبات المتعددة الوسائط (على سبيل المثال، أنواع MIME المتوافقة ووقت تقديم ملف الإدخال في الطلب).

متطلبات خاصة بحِزم تطوير البرامج (SDK) الخاصة بحزمة Vertex AI for Firebase

بالنسبة إلى حِزم تطوير البرامج (SDK) الخاصة بحزمة Vertex AI for Firebase، يكون الحدّ الأقصى لحجم الطلب هو 20 ميغابايت. إذا كان الطلب كبيرًا جدًا، تظهر لك رسالة خطأ HTTP 413.