Ringkasan pengeditan gambar dengan Imagen


Hanya tersedia saat menggunakan Vertex AI Gemini API sebagai penyedia API Anda.


SDK Firebase AI Logic memberi Anda akses ke model Imagen (melalui Imagen API) sehingga Anda dapat mengedit gambar menggunakan:

  • Pengeditan berbasis mask, seperti menyisipkan dan menghapus objek, memperluas konten gambar di luar batas asli, dan mengganti latar belakang

  • Opsi penyesuaian berdasarkan gaya (seperti pola, tekstur, atau gaya artis), subjek (seperti produk, orang, atau hewan), atau kontrol (seperti sketsa yang digambar tangan).

Halaman ini menjelaskan setiap opsi pengeditan secara umum. Setiap opsi memiliki halamannya sendiri yang berisi detail dan contoh kode lainnya.

Model yang mendukung kemampuan ini

Imagen menawarkan pengeditan gambar melalui model capability:

  • imagen-3.0-capability-001

Perhatikan bahwa untuk model Imagen, lokasi global tidak didukung.

Pengeditan berbasis mask

Pengeditan berbasis mask memungkinkan Anda melakukan perubahan yang dilokalkan dan akurat pada gambar. Model membuat perubahan secara eksklusif dalam area yang disamarkan yang ditentukan pada gambar. Masker adalah overlay digital yang menentukan area spesifik yang ingin Anda edit. Area yang ditutupi dapat dideteksi dan dibuat secara otomatis oleh model atau ditentukan dalam gambar yang ditutupi yang Anda berikan. Bergantung pada kasus penggunaan, model mungkin memerlukan perintah teks untuk mengetahui perubahan yang harus dilakukan.

Berikut adalah kasus penggunaan umum untuk pengeditan berbasis masker:

Menyisipkan objek (inpainting)

Anda dapat menggunakan inpainting untuk menyisipkan objek ke dalam gambar.

Cara kerjanya: Anda memberikan gambar asli dan gambar yang sesuai dengan mask — baik yang dibuat otomatis maupun yang Anda berikan — yang menentukan mask di area tempat Anda ingin menambahkan konten baru. Anda juga dapat memberikan perintah teks yang menjelaskan apa yang ingin Anda tambahkan. Kemudian, model akan membuat dan menambahkan konten baru dalam area yang diberi mask.

Misalnya, Anda dapat menutupi tabel dan meminta model untuk menambahkan vas bunga.

Menghapus objek (inpainting)

Anda dapat menggunakan inpainting untuk menghapus objek dari gambar.

Cara kerjanya: Anda memberikan gambar asli dan gambar yang sesuai dengan mask — yang dibuat secara otomatis atau diberikan oleh Anda — yang menentukan mask pada objek atau subjek yang ingin Anda hapus. Anda juga dapat memberikan perintah teks yang menjelaskan apa yang ingin Anda hapus, atau model dapat mendeteksi secara cerdas objek mana yang akan dihapus. Kemudian, model akan menghapus objek dan mengisi area dengan konten baru yang sesuai secara kontekstual.

Misalnya, Anda dapat menutupi bola dan menggantinya dengan dinding kosong atau lapangan berumput.

Memperluas gambar di luar batas aslinya (outpainting)

Anda dapat menggunakan outpainting untuk memperluas gambar di luar batas aslinya.

Cara kerjanya: Anda memberikan gambar asli dan gambar yang sesuai dengan mask — baik yang dibuat secara otomatis maupun yang Anda berikan — yang menentukan mask area baru yang diperluas. Anda juga dapat secara opsional memberikan perintah teks yang menjelaskan apa yang Anda inginkan di area yang diluaskan, atau model dapat secara cerdas memutuskan apa yang akan melanjutkan adegan yang ada secara logis. Model membuat konten baru dan mengisi area yang tertutup.

Misalnya, Anda dapat mengubah rasio aspek gambar atau menambahkan konteks latar belakang.

Mengganti latar belakang

Anda dapat mengganti latar belakang gambar.

Cara kerjanya: Anda memberikan gambar asli dan gambar yang sesuai dengan mask yang menentukan mask di latar belakang — baik menggunakan deteksi latar belakang otomatis atau memberikan mask latar belakang sendiri. Anda juga memberikan perintah teks yang menjelaskan apa yang ingin Anda ubah. Kemudian, model akan membuat dan menerapkan latar belakang baru.

Misalnya, Anda dapat mengubah setelan di sekitar subjek atau objek tanpa memengaruhi latar depan (misalnya, dalam gambar produk).

Penyesuaian

Penyesuaian memungkinkan Anda mengedit atau membuat gambar menggunakan perintah teks dan gambar referensi yang memandu model untuk membuat gambar baru berdasarkan gaya, subjek (seperti produk, orang, atau hewan), atau kontrol yang ditentukan.

Menyesuaikan berdasarkan gaya

Anda dapat mengedit atau membuat gambar berdasarkan gaya yang ditentukan.

Cara kerjanya: Anda memberikan perintah teks dan setidaknya satu gambar referensi yang menunjukkan gaya tertentu (seperti pola, tekstur, atau gaya desain). Model menggunakan input ini untuk membuat gambar baru berdasarkan gaya yang ditentukan dalam gambar referensi.

Misalnya, Anda dapat membuat gambar baru dapur berdasarkan gambar dari katalog retail populer yang Anda berikan.

Menyesuaikan berdasarkan subjek

Anda dapat mengedit atau membuat gambar berdasarkan subjek yang ditentukan.

Cara kerjanya: Anda memberikan perintah teks dan minimal satu gambar referensi yang menampilkan subjek tertentu (seperti produk, orang, atau hewan peliharaan). Model menggunakan input ini untuk membuat gambar baru berdasarkan subjek yang ditentukan dalam gambar referensi.

Misalnya, Anda dapat meminta model untuk menerapkan gaya kartun pada foto anak atau mengubah warna sepeda dalam gambar.

Menyesuaikan berdasarkan kontrol

Anda dapat mengedit atau membuat gambar berdasarkan kontrol yang ditentukan.

Cara kerjanya: Anda memberikan perintah teks dan setidaknya satu gambar referensi kontrol (seperti gambar sketsa atau gambar tepi Canny). Model menggunakan input ini untuk membuat gambar baru berdasarkan gambar kontrol.

Misalnya, Anda dapat memberikan gambar roket dan bulan kepada model bersama dengan perintah teks untuk membuat lukisan cat air berdasarkan gambar tersebut.


Memberikan masukan tentang pengalaman Anda dengan Firebase AI Logic