توسيع محتوى صورة باستخدام ميزة "الرسم الخارجي" في Imagen


توضّح هذه الصفحة كيفية استخدام ميزة التوسيع التلقائي باستخدام Imagen من أجل توسيع محتوى الصورة إلى ما بعد حدودها الأصلية باستخدام حِزم تطوير البرامج (SDK) الخاصة بـ Firebase AI Logic.

التوسيع الخارجي هو نوع من التعديل المستند إلى القناع. القناع هو طبقة رقمية تحدّد المنطقة المحدّدة التي تريد تعديلها.

طريقة العمل: يمكنك تقديم صورة أصلية وصورة مقنّعة مطابقة، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا للمنطقة الجديدة الموسّعة. يمكنك أيضًا تقديم طلب نصي اختياري يصف ما تريده في المنطقة الموسَّعة، أو يمكن للنموذج أن يقرّر بذكاء ما سيستمر بشكل منطقي في المشهد الحالي. ينشئ النموذج المحتوى الجديد ويملأ المنطقة المخفية.

على سبيل المثال، يمكنك تغيير نسبة العرض إلى الارتفاع في صورة أو إضافة المزيد من سياق الخلفية.

الانتقال إلى الرمز

قبل البدء

لا تتوفّر هذه الميزة إلا عند استخدام Vertex AI Gemini API كموفّر لواجهة برمجة التطبيقات.

إذا لم يسبق لك إجراء ذلك، أكمل دليل بدء الاستخدام الذي يوضّح كيفية إعداد مشروعك على Firebase وربط تطبيقك بـ Firebase وإضافة حزمة تطوير البرامج (SDK) وتهيئة خدمة الخلفية لمزوّد واجهة برمجة التطبيقات الذي اخترته وإنشاء مثيل ImagenModel.

الطُرز التي تتيح هذه الإمكانية

توفّر Imagen إمكانية تعديل الصور من خلال نموذج capability:

  • imagen-3.0-capability-001

يُرجى العِلم أنّه بالنسبة إلى طُرز Imagen، لا يتوفّر الموقع الجغرافي global .

توسيع محتوى صورة

قبل تجربة هذا النموذج، أكمل قسم قبل البدء في هذا الدليل لإعداد مشروعك وتطبيقك.

يوضّح المثال التالي كيفية توسيع صورة إلى ما بعد حدودها الأصلية — باستخدام قناع محدّد في صورة تقدّمها. يجب تقديم الصورة الأصلية وطلب نصي والصورة التي تم إخفاء أجزاء منها. يُرجى ملاحظة ما يلي بشأن الصورة الأصلية والصورة المخفية:

  • يجب أن تكون أبعاد الصورة المقنّعة بالبكسل هي أبعاد الحجم المستهدف للصورة النهائية التي تم توسيعها.

  • يجب أن تتضمّن الصورة الأصلية مساحة متروكة إضافية لتتطابق مع أبعاد البكسل الخاصة بالصورة المخفية.

إنّ تقديم طلب نصي هو أمر اختياري إذا أردت أن يقرّر النموذج بشكل ذكي ما سيتم إضافته بشكل منطقي إلى المشهد الحالي. إذا كنت تريد محتوًى معيّنًا في المنطقة الموسَّعة، عليك تحديد ذلك في طلب نصي.

Swift

لا تتوافق لغة Swift مع تعديل الصور باستخدام نماذج Imagen. يُرجى التحقّق مجددًا في وقت لاحق من هذا العام.

Kotlin

لتوسيع صورة، استخدِم editImage() واضبط إعدادات التعديل على ImagenEditMode.OUTPAINT.
يُرجى العِلم أنّه يمكنك اختياريًا استخدام outpaintImage() بدلاً من editImage()، ولست بحاجة إلى تحديد وضع التعديل.

يمكنك الاطّلاع على دليل البدء السريع للحصول على رمز نموذجي للرسم خارج حدود اللوحة.

Java

لتوسيع صورة، استخدِم editImage() واضبط إعدادات التعديل على ImagenEditMode.OUTPAINT.
يُرجى العِلم أنّه يمكنك اختياريًا استخدام outpaintImage() بدلاً من editImage()، ولست بحاجة إلى تحديد وضع التعديل.

يمكنك الاطّلاع على دليل البدء السريع للحصول على رمز نموذجي للرسم خارج حدود اللوحة.

Web

لا يمكن تعديل الصور باستخدام نماذج Imagen في تطبيقات الويب. يُرجى التحقّق مجددًا في وقت لاحق من هذا العام.

Dart

لتوسيع صورة، استخدِم editImage() واضبط إعدادات التعديل على ImagenEditMode.OUTPAINT.

يمكنك الاطّلاع على دليل البدء السريع للحصول على رمز نموذجي للرسم خارج حدود اللوحة.

Unity

لا تتوافق نماذج Imagen مع Unity عند تعديل الصور. يُرجى التحقّق مجددًا في وقت لاحق من هذا العام.

أفضل الممارسات والقيود

ننصحك بتوسيع القناع عند تعديل صورة. يمكن أن يساعد ذلك في تنعيم حواف التعديل وجعلها تبدو أكثر إقناعًا. بشكل عام، ننصح بقيمة تمدّد تبلغ% 1 أو% 2 (0.01 أو 0.02).


تقديم ملاحظات حول تجربتك مع Firebase AI Logic