Panoramica della modifica delle immagini con Imagen


Disponibile solo quando utilizzi Vertex AI Gemini API come fornitore di API.


Gli SDK Firebase AI Logic ti danno accesso ai modelli Imagen (tramite l'API Imagen) in modo che tu possa modificare le immagini utilizzando:

  • Modifica basata su maschera , ad esempio inserimento e rimozione di oggetti, espansione dei contenuti dell'immagine oltre i bordi originali e sostituzione degli sfondi

  • Opzioni di personalizzazione basate su stile (ad esempio motivo, texture o stile artistico), soggetto (ad esempio prodotto, persona o animale) o controllo (ad esempio uno schizzo disegnato a mano).

Questa pagina descrive ogni opzione di modifica a livello generale. Ogni opzione ha una pagina separata con maggiori dettagli ed esempi di codice.

Modelli che supportano questa funzionalità

Imagen offre la modifica delle immagini tramite il modello capability:

  • imagen-3.0-capability-001

Tieni presente che per i modelli Imagen la località global non è supportata.

Modifica basata su maschera

La modifica basata su maschera ti consente di apportare modifiche localizzate e precise a un'immagine. Il modello apporta modifiche esclusivamente all'interno di un' area mascherata definita dell'immagine. Una maschera è una sovrapposizione digitale che definisce l'area specifica che vuoi modificare. L'area mascherata può essere rilevata e creata automaticamente dal modello o definita in un'immagine mascherata che fornisci. A seconda del caso d'uso, il modello potrebbe richiedere un prompt di testo per sapere quali modifiche apportare.

Ecco i casi d'uso comuni per la modifica basata su maschera:

Inserire oggetti (inpainting)

Puoi utilizzare l'inpainting per inserire oggetti in un'immagine.

Come funziona: fornisci un'immagine originale e un' immagine mascherata corrispondente, generata automaticamente o fornita da te, che definisce una maschera su un'area in cui vuoi aggiungere nuovi contenuti. Fornisci anche un prompt di testo che descrive ciò che vuoi aggiungere. Il modello genera e aggiunge nuovi contenuti all'interno dell'area mascherata.

Ad esempio, puoi mascherare un tavolo e chiedere al modello di aggiungere un vaso di fiori.

Rimuovere oggetti (inpainting)

Puoi utilizzare l'inpainting per rimuovere oggetti da un'immagine.

Come funziona: fornisci un'immagine originale e un' immagine mascherata corrispondente, generata automaticamente o fornita da te, che definisce una maschera sull'oggetto o sul soggetto che vuoi rimuovere. Puoi anche fornire facoltativamente un prompt di testo che descrive ciò che vuoi rimuovere oppure il modello può rilevare in modo intelligente quale oggetto rimuovere. Il modello rimuove l'oggetto e riempie l'area con nuovi contenuti contestualmente appropriati.

Ad esempio, puoi mascherare una palla e sostituirla con una parete vuota o un campo erboso.

Espandere un'immagine oltre i bordi originali (outpainting)

Puoi utilizzare l'outpainting per espandere un'immagine oltre i bordi originali.

Come funziona: fornisci un'immagine originale e un' immagine mascherata corrispondente, generata automaticamente o fornita da te, che definisce una maschera della nuova area espansa. Puoi anche fornire facoltativamente un prompt di testo che descrive ciò che vuoi nell'area espansa oppure il modello può decidere in modo intelligente cosa continuerà logicamente la scena esistente. Il modello genera i nuovi contenuti e riempie l'area mascherata.

Ad esempio, puoi modificare le proporzioni di un'immagine o aggiungere altro contesto di sfondo.

Sostituire lo sfondo

Puoi sostituire lo sfondo di un'immagine.

Come funziona: fornisci un'immagine originale e un'immagine mascherata corrispondente che definisce una maschera sullo sfondo, utilizzando il rilevamento automatico dello sfondo o fornendo tu stesso la maschera dello sfondo. Fornisci anche un prompt di testo che descrive ciò che vuoi modificare. Il modello genera e applica un nuovo sfondo.

Ad esempio, puoi modificare l'impostazione intorno a un soggetto o a un oggetto senza influire sul primo piano (ad esempio, in un'immagine prodotto).

Personalizzazione

La personalizzazione ti consente di modificare o generare immagini utilizzando prompt di testo e immagini di riferimento che guidano il modello a generare una nuova immagine in base a uno stile, soggetto (ad esempio un prodotto, una persona o un animale) o un controllo specificato.

Personalizzare in base a uno stile

Puoi modificare o generare immagini in base a uno stile specificato.

Come funziona: fornisci un prompt di testo e almeno un' immagine di riferimento che mostra uno stile specifico (ad esempio un motivo, una texture o uno stile di design). Il modello utilizza questi input per generare una nuova immagine in base a allo stile specificato nelle immagini di riferimento.

Ad esempio, puoi generare una nuova immagine di una cucina basata su un'immagine di un catalogo di vendita al dettaglio popolare che fornisci.

Personalizzare in base a un soggetto

Puoi modificare o generare immagini in base a un soggetto specificato.

Come funziona: fornisci un prompt di testo e almeno un' immagine di riferimento che mostra un soggetto specifico (ad esempio un prodotto, una persona o un animale domestico). Il modello utilizza questi input per generare una nuova immagine basata sul soggetto specificato nelle immagini di riferimento.

Ad esempio, puoi chiedere al modello di applicare uno stile cartone animato a una foto di un bambino o di modificare il colore di una bicicletta in una foto.

Personalizzare in base a un controllo

Puoi modificare o generare immagini in base a un controllo specificato.

Come funziona: fornisci un prompt di testo e almeno un' immagine di riferimento di controllo (ad esempio un disegno o un'immagine con bordi Canny). Il modello utilizza questi input per generare una nuova immagine in base alle immagini di controllo.

Ad esempio, puoi fornire al modello un disegno di un razzo e della luna insieme a un prompt di testo per creare un dipinto ad acquerello basato sul disegno.


Dai il tuo feedback sulla tua esperienza con Firebase AI Logic