توسيع محتوى صورة باستخدام ميزة "الرسم الخارجي" في Imagen


تتناول هذه الصفحة كيفية استخدام ميزة توسيع الصورة باستخدام Imagen لتوسيع محتوى الصورة خارج حدودها الأصلية باستخدام حِزم تطوير البرامج (SDK) لمنطق الذكاء الاصطناعي في Firebase.Firebase AI Logic

توسيع الصورة هو نوع من التعديل المستند إلى القناع. القناع هو طبقة رقمية تحدّد المنطقة المحدّدة التي تريد تعديلها.

آلية العمل: يمكنك تقديم صورة أصلية و صورة مقنّعة مقابلة لها، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا للمنطقة الجديدة الموسَّعة. يمكنك أيضًا تقديم طلب نصي اختياري يصف ما تريده في المنطقة الموسَّعة، أو يمكن للنموذج أن يقرّر بذكاء ما سيستمر منطقيًا في المشهد الحالي. ينشئ النموذج المحتوى الجديد ويملأ المنطقة المقنّعة.

على سبيل المثال، يمكنك تغيير نسبة العرض إلى الارتفاع في الصورة أو إضافة المزيد من سياق الخلفية.

الانتقال إلى الرمز

قبل البدء

لا تتوفّر هذه الميزة إلا عند استخدام Vertex AI Gemini API كمزوّد واجهة برمجة التطبيقات.

إذا لم يسبق لك ذلك، يُرجى إكمال دليل البدء الذي يوضّح كيفية إعداد مشروعك على Firebase وربط تطبيقك بـ Firebase و إضافة حزمة تطوير البرامج (SDK) وتهيئة خدمة الخلفية لمزوّد واجهة برمجة التطبيقات الذي اخترته و إنشاء مثيل ImagenModel.

النماذج التي تتيح هذه الإمكانية

Imagen توفّر إمكانية تعديل الصور من خلال نموذج capability:

  • imagen-3.0-capability-001

يُرجى العِلم أنّه بالنسبة إلى نماذج Imagen، لا يتوفّر الموقع الجغرافي global .

توسيع محتوى الصورة

قبل تجربة هذا النموذج، يُرجى إكمال قسم قبل البدء في هذا الدليل لإعداد مشروعك وتطبيقك.

يوضّح النموذج التالي كيفية توسيع صورة خارج حدودها الأصلية باستخدام قناع محدّد في صورة تقدّمها أنت. عليك تقديم الصورة الأصلية وطلب نصي والصورة المقنّعة. يُرجى العِلم بما يلي بشأن الصورة الأصلية والمقنّعة:

  • يجب أن تكون أبعاد الصورة المقنّعة بالبكسل هي الأبعاد المستهدَفة للصورة النهائية الموسَّعة.

  • يجب أن تتضمّن الصورة الأصلية مساحة إضافية لتتطابق مع أبعاد الصورة المقنّعة بالبكسل.

إنّ تقديم طلب نصي اختياري إذا أردت أن يقرّر النموذج بذكاء ما سيستمر منطقيًا في المشهد الحالي. إذا أردت محتوى محدّدًا في المنطقة الموسَّعة، عليك تحديد ذلك في طلب نصي.

Swift

لا تتوفّر إمكانية تعديل الصور باستخدام نماذج Imagen في Swift. يُرجى إعادة المحاولة في وقت لاحق من هذا العام.

Kotlin

لتوسيع صورة، استخدِم editImage() واضبط إعدادات التعديل لاستخدام ImagenEditMode.OUTPAINT.
يُرجى العِلم أنّه يمكنك اختياريًا استخدام outpaintImage() بدلاً من editImage()، ولن تحتاج إلى تحديد وضع التعديل.

يمكنك الاطّلاع على دليل البدء السريع للحصول على نموذج رمز لتوسيع الصورة.

Java

لتوسيع صورة، استخدِم editImage() واضبط إعدادات التعديل لاستخدام ImagenEditMode.OUTPAINT.
يُرجى العِلم أنّه يمكنك اختياريًا استخدام outpaintImage() بدلاً من editImage()، ولن تحتاج إلى تحديد وضع التعديل.

يمكنك الاطّلاع على دليل البدء السريع للحصول على نموذج رمز لتوسيع الصورة.

Web

لا تتوفّر إمكانية تعديل الصور باستخدام نماذج Imagen في تطبيقات الويب. يُرجى إعادة المحاولة في وقت لاحق من هذا العام.

Dart

لتوسيع صورة، استخدِم editImage() واضبط إعدادات التعديل لاستخدام ImagenEditMode.OUTPAINT.

يمكنك الاطّلاع على دليل البدء السريع للحصول على نموذج رمز لتوسيع الصورة.

Unity

لا تتوفّر إمكانية تعديل الصور باستخدام نماذج Imagen في Unity. يُرجى إعادة المحاولة في وقت لاحق من هذا العام.

أفضل الممارسات والمحدودية

ننصح بتوسيع القناع عند تعديل صورة. يمكن أن يساعد ذلك في تلطيف حدود التعديل وجعلها تبدو أكثر إقناعًا. ننصح بشكل عام باستخدام قيمة توسيع تبلغ% 1 أو% 2 (0.01 أو 0.02).


تقديم ملاحظات حول تجربتك معFirebase AI Logic