ملفات الإدخال ومتطلّبات واجهة برمجة التطبيقات Vertex AI Gemini

عند طلب واجهة برمجة تطبيقات Vertex AI Gemini من تطبيقك باستخدام حزمة تطوير البرامج (SDK) الخاصة بالذكاء الاصطناعي من Vertex AI for Firebase، يمكنك أن تطلب من نموذج Gemini إنشاء نص استنادًا إلى إدخال متعدد الوسائط. يمكن أن تتضمن الطلبات المتعددة الوسائط عدة وسائط (أو أنواع إدخال)، مثل النص مع الصور وملفات PDF والفيديو والصوت.

بالنسبة إلى الأجزاء غير النصية في الإدخال (مثل ملفات الوسائط)، ستحتاج إلى استخدام أنواع ملفات متوافقة، وتحديد نوع MIME متوافق، والتأكّد من أنّ الملفات والطلبات المتعددة الوسائط تستوفي المتطلبات وتتّبع أفضل الممارسات.

  • تختلف ملفات الإدخال المتوافقة حسب الطراز، ويمكن أن تتضمن الصور وملفات PDF والفيديو والملفات الصوتية.

    • يُرجى العِلم أنّ إدخال الفيديو المتوافق يختلف أيضًا حسب النموذج ويمكن أن يتضمّن إطارات فقط أو إطارات تتضمّن صوتًا.
  • المتطلبات وأفضل الممارسات المتعلقة بملفات الإدخال والطلبات المتعددة الوسائط:

    • في مزيد من المعلومات حول نماذج Gemini، يمكنك العثور على ملخّص سريع لمتطلبات الملفات المتوافقة حسب النموذج (مثل الحدّ الأقصى لعدد الملفات والحدّ الأقصى لحجم الملف).

    • ضمن مستندات Google Cloud، يمكنك الاطّلاع على معلومات مفصَّلة حول المتطلبات وأفضل الممارسات لملفات الإدخال والطلبات المتعددة الوسائط (على سبيل المثال، أنواع MIME المتوافقة والحالات التي يجب فيها تقديم ملف الإدخال في الطلب).

متطلبات خاصة بحِزم تطوير البرامج (SDK) الخاصة بحزمة Vertex AI for Firebase

بالنسبة إلى حِزم تطوير البرامج (SDK) الخاصة بحزمة Vertex AI for Firebase، يكون الحدّ الأقصى لحجم الطلب 20 ميغابايت. إذا كان الطلب كبيرًا جدًا، ستحصل على خطأ HTTP 413.