Ringkasan pengeditan gambar dengan Imagen


Hanya tersedia saat menggunakan Vertex AI Gemini API sebagai penyedia API Anda.


Firebase AI Logic SDK memberi Anda akses ke Imagen model (melalui Imagen API) sehingga Anda dapat mengedit gambar menggunakan:

  • **Pengeditan berbasis mask**, seperti menyisipkan dan menghapus objek, memperluas konten gambar di luar batas asli, dan mengganti latar belakang

  • Opsi **penyesuaian** berdasarkan gaya (seperti pola, tekstur, atau gaya artis), subjek (seperti produk, orang, atau hewan), atau kontrol (seperti sketsa yang digambar tangan).

Halaman ini menjelaskan setiap opsi pengeditan di tingkat tinggi. Setiap opsi memiliki halamannya sendiri yang berisi detail dan contoh kode selengkapnya.

Model yang mendukung kemampuan ini

Imagen menawarkan pengeditan gambar melalui model capability:

  • imagen-3.0-capability-001

Perhatikan bahwa untuk Imagen model, lokasi global tidak didukung.

Pengeditan berbasis mask

Pengeditan berbasis mask memungkinkan Anda membuat perubahan lokal dan presisi pada gambar. Model ini membuat perubahan secara eksklusif dalam area mask gambar yang ditentukan. Mask adalah overlay digital yang menentukan area tertentu yang ingin Anda edit. Area mask dapat dideteksi dan dibuat secara otomatis oleh model atau ditentukan dalam gambar mask yang Anda berikan. Bergantung pada kasus penggunaan, model mungkin memerlukan perintah teks untuk mengetahui perubahan yang akan dibuat.

Berikut adalah kasus penggunaan umum untuk pengeditan berbasis mask:

Menyisipkan objek (inpainting)

Anda dapat menggunakan inpainting untuk menyisipkan objek ke dalam gambar.

Cara kerjanya: Anda memberikan gambar asli dan gambar mask yang sesuai — baik yang dibuat secara otomatis maupun yang Anda berikan — yang menentukan mask di area tempat Anda ingin menambahkan konten baru. Anda juga memberikan perintah teks yang menjelaskan apa yang ingin Anda tambahkan. Kemudian, model akan membuat dan menambahkan konten baru dalam area mask.

Misalnya, Anda dapat membuat mask pada meja dan meminta model untuk menambahkan vas bunga.

Menghapus objek (inpainting)

Anda dapat menggunakan inpainting untuk menghapus objek dari gambar.

Cara kerjanya: Anda memberikan gambar asli dan gambar mask yang sesuai — baik yang dibuat secara otomatis maupun yang Anda berikan — yang menentukan mask pada objek atau subjek yang ingin Anda hapus. Anda juga dapat secara opsional memberikan perintah teks yang menjelaskan apa yang ingin Anda hapus, atau model dapat mendeteksi secara cerdas objek mana yang akan dihapus. Kemudian, model akan menghapus objek dan mengisi area tersebut dengan konten baru yang sesuai dengan konteks.

Misalnya, Anda dapat membuat mask pada bola dan menggantinya dengan dinding kosong atau lapangan berumput.

Memperluas gambar di luar batas aslinya (outpainting)

Anda dapat menggunakan outpainting untuk memperluas gambar di luar batas aslinya.

Cara kerjanya: Anda memberikan gambar asli dan gambar mask yang sesuai — baik yang dibuat secara otomatis maupun yang Anda berikan — yang menentukan mask area baru yang diperluas. Anda juga dapat secara opsional memberikan perintah teks yang menjelaskan apa yang Anda inginkan di area yang diperluas, atau model dapat memutuskan secara cerdas apa yang akan melanjutkan adegan yang ada secara logis. Model akan membuat konten baru dan mengisi area mask.

Misalnya, Anda dapat mengubah rasio aspek gambar atau menambahkan lebih banyak konteks latar belakang.

Mengganti latar belakang

Anda dapat mengganti latar belakang gambar.

Cara kerjanya: Anda memberikan gambar asli dan gambar mask yang sesuai yang menentukan mask di latar belakang — baik menggunakan deteksi latar belakang otomatis maupun memberikan mask latar belakang sendiri. Anda juga memberikan perintah teks yang menjelaskan perubahan yang ingin Anda buat. Kemudian, model akan membuat dan menerapkan latar belakang baru.

Misalnya, Anda dapat mengubah setelan di sekitar subjek atau objek tanpa memengaruhi latar depan (misalnya, dalam gambar produk).

Penyesuaian

Penyesuaian memungkinkan Anda mengedit atau membuat gambar menggunakan perintah teks dan gambar referensi yang memandu model untuk membuat gambar baru berdasarkan gaya, subjek (seperti produk, orang, atau hewan), atau kontrol yang ditentukan.

Menyesuaikan berdasarkan gaya

Anda dapat mengedit atau membuat gambar berdasarkan gaya yang ditentukan.

Cara kerjanya: Anda memberikan perintah teks dan setidaknya satu gambar referensi yang menunjukkan gaya tertentu (seperti pola, tekstur, atau gaya desain). Model menggunakan input ini untuk membuat gambar baru berdasarkan gaya yang ditentukan dalam gambar referensi.

Misalnya, Anda dapat membuat gambar baru dapur berdasarkan gambar dari katalog retail populer yang Anda berikan.

Menyesuaikan berdasarkan subjek

Anda dapat mengedit atau membuat gambar berdasarkan subjek yang ditentukan.

Cara kerjanya: Anda memberikan perintah teks dan setidaknya satu gambar referensi yang menunjukkan subjek tertentu (seperti produk, orang, atau hewan peliharaan). Model menggunakan input ini untuk membuat gambar baru berdasarkan subjek yang ditentukan dalam gambar referensi.

Misalnya, Anda dapat meminta model untuk menerapkan gaya kartun ke foto anak atau mengubah warna sepeda dalam gambar.

Menyesuaikan berdasarkan kontrol

Anda dapat mengedit atau membuat gambar berdasarkan kontrol yang ditentukan.

Cara kerjanya: Anda memberikan perintah teks dan setidaknya satu kontrol gambar referensi (seperti gambar atau gambar tepi Canny). Model menggunakan input ini untuk membuat gambar baru berdasarkan gambar kontrol.

Misalnya, Anda dapat memberikan gambar pesawat roket dan bulan kepada model bersama dengan perintah teks untuk membuat lukisan cat air berdasarkan gambar tersebut.


Memberikan masukan tentang pengalaman Anda dengan Firebase AI Logic