لا تتوفّر هذه الميزة إلا عند استخدام Vertex AI Gemini API كموفّر لواجهة برمجة التطبيقات. |
تتيح لك حِزم تطوير البرامج (SDK) في Firebase AI Logic الوصول إلى نماذج Imagen (من خلال واجهة برمجة التطبيقات Imagen) لتتمكّن من تعديل الصور باستخدام أي مما يلي:
التعديل المستند إلى القناع، مثل إدراج الكائنات وإزالتها، وتوسيع محتوى الصورة إلى ما بعد الحدود الأصلية، واستبدال الخلفيات
خيارات التخصيص استنادًا إلى النمط (مثل النمط أو الملمس أو أسلوب الفنان) أو الموضوع (مثل المنتج أو الشخص أو الحيوان) أو التحكّم (مثل رسم تخطيطي مرسوم يدويًا).
توضّح هذه الصفحة كل خيار تعديل بشكل عام. يتضمّن كل خيار صفحة منفصلة تتضمّن المزيد من التفاصيل ونماذج الرموز البرمجية.
الطُرز التي تتيح هذه الإمكانية
توفّر Imagen إمكانية تعديل الصور من خلال نموذج capability
:
imagen-3.0-capability-001
يُرجى العِلم أنّه بالنسبة إلى طُرز Imagen، لا يتوفّر الموقع الجغرافي global
.
التعديل المستند إلى القناع
تتيح لك ميزة التعديل المستند إلى القناع إجراء تغييرات دقيقة وموضعية على صورة. تجري النماذج تغييرات حصريًا ضمن منطقة مقنَّعة محدّدة من الصورة. القناع هو طبقة رقمية تحدّد المنطقة المحدّدة التي تريد تعديلها. يمكن أن يرصد النموذج المنطقة المخفية ويُنشئها تلقائيًا، أو يمكن تحديدها في صورة مخفية تقدّمها أنت. واستنادًا إلى حالة الاستخدام، قد يتطلّب النموذج طلبًا نصيًا لمعرفة التغييرات التي يجب إجراؤها.
في ما يلي حالات الاستخدام الشائعة للتعديل المستند إلى القناع:
- إدراج عناصر جديدة في صورة
- إزالة العناصر غير المرغوب فيها من صورة
- توسيع محتوى الصورة إلى ما بعد حدودها الأصلية
- استبدال خلفية صورة
إدراج عناصر (الترميم)
يمكنك استخدام ميزة "الرسم الداخلي" من أجل إدراج عناصر في صورة.
طريقة العمل: يمكنك تقديم صورة أصلية وصورة مقنّعة مطابقة، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا فوق منطقة تريد إضافة محتوى جديد إليها. يمكنك أيضًا تقديم طلب نصي يصف ما تريد إضافته. بعد ذلك، ينشئ النموذج محتوًى جديدًا ويضيفه إلى المنطقة المخفية.
على سبيل المثال، يمكنك إخفاء جدول وطلب إضافة مزهرية من الزهور إلى الصورة.
إزالة العناصر (الترميم)
يمكنك استخدام تقنية "الرسم الداخلي" من أجل إزالة عناصر من صورة.
طريقة العمل: يمكنك تقديم صورة أصلية وصورة مقنّعة مقابلة، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا فوق العنصر أو الموضوع الذي تريد إزالته. يمكنك أيضًا تقديم طلب نصي اختياري يصف ما تريد إزالته، أو يمكن للنموذج أن يرصد بذكاء العنصر الذي تريد إزالته. يزيل النموذج بعد ذلك الكائن ويملأ المساحة بمحتوى جديد مناسب للسياق.
على سبيل المثال، يمكنك إخفاء كرة واستبدالها بجدار فارغ أو حقل عشبي.
توسيع صورة إلى ما هو أبعد من حدودها الأصلية (Outpainting)
يمكنك استخدام الرسم خارج الصورة من أجل توسيع صورة خارج حدودها الأصلية.
طريقة العمل: يمكنك تقديم صورة أصلية وصورة مقنّعة مطابقة، سواء تم إنشاؤها تلقائيًا أو قدّمتها أنت، وتحدّد هذه الصورة قناعًا للمنطقة الجديدة الموسّعة. يمكنك أيضًا تقديم طلب نصي اختياري يصف ما تريده في المنطقة الموسَّعة، أو يمكن للنموذج أن يقرّر بذكاء ما سيستمر بشكل منطقي في المشهد الحالي. ينشئ النموذج المحتوى الجديد ويملأ المنطقة المخفية.
على سبيل المثال، يمكنك تغيير نسبة العرض إلى الارتفاع في صورة أو إضافة المزيد من سياق الخلفية.
استبدال الخلفية
يمكنك استبدال خلفية صورة.
طريقة العمل: عليك تقديم صورة أصلية وصورة مقنّعة مقابلة تحدّد قناعًا فوق الخلفية، إما باستخدام ميزة رصد الخلفية التلقائي أو من خلال تقديم قناع الخلفية بنفسك. يمكنك أيضًا تقديم طلب نصي يصف التغيير الذي تريد إجراءه. بعد ذلك، ينشئ النموذج خلفية جديدة ويطبّقها.
على سبيل المثال، يمكنك تغيير الإعدادات حول موضوع أو كائن بدون التأثير في المقدمة (على سبيل المثال، في صورة منتج).
التخصيص
تتيح لك ميزة التخصيص تعديل الصور أو إنشائها باستخدام طلبات نصية وصور مرجعية توجّه النموذج لإنشاء صورة جديدة استنادًا إلى نمط أو موضوع (مثل منتج أو شخص أو حيوان) أو عنصر تحكّم محدّد.
التخصيص استنادًا إلى نمط
يمكنك تعديل الصور أو إنشاؤها استنادًا إلى نمط محدّد.
طريقة العمل: يمكنك تقديم طلب نصي وصورة مرجعية واحدة على الأقل تعرض نمطًا معيّنًا (مثل نقش أو ملمس أو نمط تصميم). يستخدم النموذج هذه المدخلات لإنشاء صورة جديدة استنادًا إلى النمط المحدّد في الصور المرجعية.
على سبيل المثال، يمكنك إنشاء صورة جديدة لمطبخ استنادًا إلى صورة من كتالوج بيع بالتجزئة شائع تقدّمه.
التخصيص استنادًا إلى موضوع
يمكنك تعديل الصور أو إنشاؤها استنادًا إلى موضوع محدّد.
طريقة العمل: يمكنك تقديم طلب نصي وصورة مرجعية واحدة على الأقل تعرض موضوعًا معيّنًا (مثل منتج أو شخص أو حيوان أليف). يستخدم النموذج هذه المدخلات لإنشاء صورة جديدة استنادًا إلى العنصر المحدّد في الصور المرجعية.
على سبيل المثال، يمكنك أن تطلب من النموذج تطبيق نمط رسوم متحركة على صورة طفل أو تغيير لون دراجة في صورة.
التخصيص استنادًا إلى عنصر تحكّم
يمكنك تعديل الصور أو إنشاؤها استنادًا إلى عنصر تحكّم محدّد.
طريقة العمل: يمكنك تقديم طلب نصي وصورة مرجعية واحدة على الأقل للتحكّم (مثل رسم أو صورة حواف Canny). يستخدم النموذج هذه المدخلات لإنشاء صورة جديدة استنادًا إلى صور التحكّم.
على سبيل المثال، يمكنك تزويد النموذج برسم لمركبة فضائية والقمر مع طلب نصي لإنشاء لوحة ألوان مائية استنادًا إلى الرسم.
تقديم ملاحظات حول تجربتك مع Firebase AI Logic