توضّح هذه الصفحة كيفية استخدام ميزة التوسيع التلقائي للصورة باستخدام Imagen من أجل توسيع محتوى الصورة إلى ما بعد حدودها الأصلية باستخدام حِزم تطوير البرامج (SDK) الخاصة بـ Firebase AI Logic.
الرسم خارج حدود الصورة هو نوع من التعديل المستند إلى القناع. القناع هو طبقة رقمية تحدّد المنطقة المحدّدة التي تريد تعديلها.
طريقة العمل: يمكنك تقديم صورة أصلية وصورة مقنّعة مقابلة، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا للمنطقة الجديدة الموسّعة. يمكنك أيضًا تقديم طلب نصي اختياري يصف ما تريده في المنطقة الموسَّعة، أو يمكن للنموذج أن يقرّر بذكاء ما سيستمر بشكل منطقي في المشهد الحالي. ينشئ النموذج المحتوى الجديد ويملأ المنطقة المخفية.
على سبيل المثال، يمكنك تغيير نسبة العرض إلى الارتفاع في صورة أو إضافة المزيد من سياق الخلفية.
قبل البدء
| لا تتوفّر هذه الميزة إلا عند استخدام Vertex AI Gemini API كموفّر لواجهة برمجة التطبيقات. |
إذا لم يسبق لك إجراء ذلك، أكمل دليل بدء الاستخدام الذي يوضّح كيفية إعداد مشروعك على Firebase وربط تطبيقك بـ Firebase وإضافة حزمة تطوير البرامج (SDK) وتهيئة خدمة الخلفية لمزوّد واجهة برمجة التطبيقات الذي اخترته وإنشاء مثيل ImagenModel.
الطُرز التي تتيح هذه الإمكانية
توفّر Imagen إمكانية تعديل الصور من خلال نموذج capability:
imagen-3.0-capability-001
يُرجى العِلم أنّه بالنسبة إلى طُرز Imagen، لا يمكن استخدام الموقع الجغرافي global.
توسيع محتوى صورة
| قبل تجربة هذا النموذج، أكمل قسم قبل البدء في هذا الدليل لإعداد مشروعك وتطبيقك. |
يوضّح المثال التالي كيفية توسيع صورة إلى ما بعد حدودها الأصلية باستخدام قناع محدّد في صورة تقدّمها. يجب تقديم الصورة الأصلية وطلب نصي والصورة التي تم إخفاء أجزاء منها. يُرجى ملاحظة ما يلي بشأن الصورة الأصلية والصورة التي تم إخفاء بعض تفاصيلها:
يجب أن تكون أبعاد الصورة المقنّعة بالبكسل هي أبعاد الحجم المستهدف للصورة النهائية التي تم توسيع حدودها.
يجب أن تتضمّن الصورة الأصلية مساحة متروكة إضافية لتتطابق مع أبعاد البكسل الخاصة بالصورة المخفية.
إنّ تقديم طلب نصي هو أمر اختياري إذا كنت تريد أن يقرّر النموذج بشكل ذكي ما سيتم عرضه بشكل منطقي في المشهد الحالي. إذا أردت الحصول على محتوى محدّد ضمن المنطقة الموسَّعة، عليك تحديد ذلك في طلب نصي.
Swift
لا تتوافق لغة Swift مع تعديل الصور باستخدام نماذج Imagen. يُرجى التحقّق من جديد في وقت لاحق من هذا العام.
Kotlin
لتوسيع صورة، استخدِم
editImage()
واضبط إعدادات التعديل على ImagenEditMode.OUTPAINT.
يُرجى العِلم أنّه يمكنك اختياريًا استخدام
outpaintImage()
بدلاً من editImage()، ولست بحاجة إلى تحديد وضع التعديل.
يمكنك الاطّلاع على دليل البدء السريع الخاص بالرمز النموذجي لإنشاء صور خارج اللوحة.
Java
لتوسيع صورة، استخدِم
editImage()
واضبط إعدادات التعديل على ImagenEditMode.OUTPAINT.
يُرجى العِلم أنّه يمكنك اختياريًا استخدام
outpaintImage()
بدلاً من editImage()، ولست بحاجة إلى تحديد وضع التعديل.
يمكنك الاطّلاع على دليل البدء السريع الخاص بالرمز النموذجي لإنشاء صور خارج اللوحة.
Web
لا تتوافق تطبيقات الويب مع تعديل الصور باستخدام نماذج Imagen. يُرجى التحقّق من جديد في وقت لاحق من هذا العام.
Dart
لتوسيع صورة، استخدِم
editImage()
واضبط إعدادات التعديل على ImagenEditMode.OUTPAINT.
يمكنك الاطّلاع على دليل البدء السريع الخاص بالرمز النموذجي لإنشاء صور خارج اللوحة.
Unity
لا تتوافق نماذج Imagen مع Unity عند تعديل الصور. يُرجى التحقّق من جديد في وقت لاحق من هذا العام.
أفضل الممارسات والقيود
ننصحك بتوسيع القناع عند تعديل صورة. يمكن أن يساعد ذلك في تنعيم حواف التعديل وجعلها تبدو أكثر إقناعًا. بشكل عام، ننصح بقيمة تمديد تبلغ% 1 أو% 2 (0.01 أو 0.02).
تقديم ملاحظات حول تجربتك مع Firebase AI Logic