| لا تتوفّر هذه الميزة إلا عند استخدام Vertex AI Gemini API كموفّر لواجهة برمجة التطبيقات. |
تتيح لك حِزم تطوير البرامج (SDK) Firebase AI Logic الوصول إلى نماذج Imagen (من خلال واجهة برمجة التطبيقات Imagen) لتتمكّن من تعديل الصور باستخدام أي مما يلي:
التعديل المستند إلى القناع، مثل إدراج الكائنات وإزالتها، وتوسيع محتوى الصورة إلى ما بعد الحدود الأصلية، واستبدال الخلفيات
خيارات التخصيص استنادًا إلى النمط (مثل النمط أو الملمس أو أسلوب الفنان) أو الموضوع (مثل المنتج أو الشخص أو الحيوان) أو التحكّم (مثل رسم تخطيطي مرسوم يدويًا).
توضّح هذه الصفحة كل خيار من خيارات التعديل بشكل عام. يتضمّن كل خيار صفحة منفصلة تتضمّن المزيد من التفاصيل ونماذج الرموز البرمجية.
الطُرز التي تتيح هذه الإمكانية
توفّر Imagen إمكانية تعديل الصور من خلال نموذج capability:
imagen-3.0-capability-001
يُرجى العِلم أنّه بالنسبة إلى نماذج Imagen، لا يمكن استخدام الموقع الجغرافي global.
التعديل المستند إلى القناع
تتيح لك ميزة التعديل المستند إلى القناع إجراء تغييرات دقيقة ومحددة على صورة. تجري النماذج تغييرات حصريًا ضمن منطقة مقنَّعة محدّدة من الصورة. القناع هو طبقة رقمية تحدّد المنطقة المحدّدة التي تريد تعديلها. يمكن للنموذج رصد المنطقة المخفية وإنشائها تلقائيًا، أو يمكنك تحديدها في صورة مخفية تقدّمها. واستنادًا إلى حالة الاستخدام، قد يتطلّب النموذج طلبًا نصيًا لمعرفة التغييرات التي يجب إجراؤها.
في ما يلي حالات الاستخدام الشائعة للتعديل المستند إلى القناع:
- إدراج عناصر جديدة في صورة
- إزالة العناصر غير المرغوب فيها من صورة
- توسيع محتوى الصورة إلى ما بعد حدودها الأصلية
- استبدال خلفية صورة
إدراج كائنات (إصلاح العيوب)
يمكنك استخدام ميزة "الرسم الداخلي" من أجل إدراج عناصر في صورة.
طريقة العمل: يمكنك تقديم صورة أصلية وصورة مقنّعة مطابقة، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا فوق منطقة تريد إضافة محتوى جديد إليها. يمكنك أيضًا تقديم طلب نصي يصف ما تريد إضافته. بعد ذلك، ينشئ النموذج محتوًى جديدًا ويضيفه إلى المنطقة المخفية.
على سبيل المثال، يمكنك إخفاء جدول وطلب إضافة مزهرية من الزهور إلى الصورة.
إزالة العناصر (الرسم داخل الصورة)
يمكنك استخدام تقنية "الرسم الداخلي" من أجل إزالة عناصر من صورة.
طريقة العمل: يمكنك تقديم صورة أصلية وصورة مقنّعة مقابلة، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا فوق العنصر أو الموضوع الذي تريد إزالته. يمكنك أيضًا تقديم طلب نصي اختياري يصف ما تريد إزالته، أو يمكن للنموذج أن يرصد بذكاء العنصر الذي تريد إزالته. يزيل النموذج بعد ذلك العنصر ويملأ المساحة بمحتوى جديد مناسب من حيث السياق.
على سبيل المثال، يمكنك إخفاء كرة واستبدالها بجدار فارغ أو حقل عشبي.
توسيع صورة إلى ما هو أبعد من حدودها الأصلية (Outpainting)
يمكنك استخدام ميزة توسيع نطاق الصور من أجل توسيع صورة خارج حدودها الأصلية.
طريقة العمل: يمكنك تقديم صورة أصلية وصورة مقنّعة مطابقة، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا للمنطقة الجديدة الموسّعة. يمكنك أيضًا تقديم طلب نصي اختياري يصف ما تريده في المنطقة الموسَّعة، أو يمكن للنموذج أن يقرّر بذكاء ما سيستمر بشكل منطقي في المشهد الحالي. ينشئ النموذج المحتوى الجديد ويملأ المنطقة المخفية.
على سبيل المثال، يمكنك تغيير نسبة العرض إلى الارتفاع في صورة أو إضافة المزيد من سياق الخلفية.
استبدال الخلفية
يمكنك استبدال خلفية صورة.
طريقة العمل: عليك تقديم صورة أصلية وصورة مقنّعة مقابلة تحدّد قناعًا فوق الخلفية، إما باستخدام ميزة رصد الخلفية التلقائي أو من خلال تقديم قناع الخلفية بنفسك. يمكنك أيضًا تقديم طلب نصي يصف التغيير الذي تريد إجراءه. بعد ذلك، ينشئ النموذج خلفية جديدة ويطبّقها.
على سبيل المثال، يمكنك تغيير الإعدادات حول موضوع أو كائن بدون التأثير في المقدمة (على سبيل المثال، في صورة منتج).
التخصيص
تتيح لك ميزة التخصيص تعديل الصور أو إنشائها باستخدام طلبات نصية وصور مرجعية توجّه النموذج لإنشاء صورة جديدة استنادًا إلى أسلوب أو موضوع (مثل منتج أو شخص أو حيوان) أو عنصر تحكّم محدّد.
التخصيص استنادًا إلى نمط
يمكنك تعديل الصور أو إنشاؤها استنادًا إلى نمط محدّد.
طريقة العمل: يمكنك تقديم طلب نصي وصورة مرجعية واحدة على الأقل تعرض نمطًا معيّنًا (مثل نقش أو ملمس أو نمط تصميم). يستخدم النموذج هذه المدخلات لإنشاء صورة جديدة استنادًا إلى النمط المحدّد في الصور المرجعية.
على سبيل المثال، يمكنك إنشاء صورة جديدة لمطبخ استنادًا إلى صورة من كتالوج بيع بالتجزئة شائع تقدّمه.
التخصيص استنادًا إلى موضوع
يمكنك تعديل الصور أو إنشاؤها استنادًا إلى موضوع محدّد.
طريقة العمل: يمكنك تقديم طلب نصي وصورة مرجعية واحدة على الأقل تعرض موضوعًا معيّنًا (مثل منتج أو شخص أو حيوان أليف). يستخدم النموذج هذه المدخلات لإنشاء صورة جديدة استنادًا إلى الموضوع المحدّد في الصور المرجعية.
على سبيل المثال، يمكنك أن تطلب من النموذج تطبيق نمط رسوم متحركة على صورة طفل أو تغيير لون دراجة في صورة.
التخصيص استنادًا إلى عنصر تحكّم
يمكنك تعديل الصور أو إنشاؤها استنادًا إلى عنصر تحكّم محدّد.
طريقة العمل: يمكنك تقديم طلب نصي وصورة مرجعية واحدة على الأقل للتحكّم (مثل رسم أو صورة حواف Canny). يستخدم النموذج هذه المدخلات لإنشاء صورة جديدة استنادًا إلى صور التحكّم.
على سبيل المثال، يمكنك تزويد النموذج برسم لمركبة فضائية والقمر مع طلب نصي لإنشاء لوحة ألوان مائية استنادًا إلى الرسم.
تقديم ملاحظات حول تجربتك مع Firebase AI Logic