Auf dieser Seite wird beschrieben, wie Sie Outpainting mit Imagen verwenden, um den Inhalt eines Bildes über seine ursprünglichen Grenzen hinaus zu erweitern mit den Firebase AI Logic SDKs.
Outpainting ist eine Art der maskenbasierten Bearbeitung. Eine Maske ist ein digitales Overlay, das den spezifischen Bereich definiert, den Sie bearbeiten möchten.
Funktionsweise: Sie stellen ein Originalbild und ein entsprechendes maskiertes Bild bereit, das entweder automatisch generiert oder von Ihnen bereitgestellt wird und eine Maske des neuen, erweiterten Bereichs definiert. Optional können Sie auch einen Text-Prompt angeben, der beschreibt, was Sie im erweiterten Bereich möchten. Das Modell kann aber auch intelligent entscheiden, wie die vorhandene Szene logisch fortgesetzt werden soll. Das Modell generiert den neuen Inhalt und füllt den maskierten Bereich aus.
Sie können beispielsweise das Seitenverhältnis eines Bildes ändern oder mehr Hintergrund Kontext hinzufügen.
Hinweis
| Nur verfügbar, wenn die Vertex AI Gemini API als Ihr API-Anbieter verwendet wird. |
Wenn Sie es noch nicht getan haben, folgen Sie der
Kurzanleitung. Dort
wird beschrieben, wie Sie Ihr Firebase-Projekt einrichten, Ihre App mit Firebase verbinden,
das SDK hinzufügen, den Back-End-Dienst für den ausgewählten API-Anbieter initialisieren und
eine ImagenModel Instanz erstellen.
Modelle, die diese Funktion unterstützen
Imagen bietet Bildbearbeitung über das capability
-Modell:
imagen-3.0-capability-001
Beachten Sie, dass der Standort global für Imagen Modelle
nicht unterstützt wird.
Inhalt eines Bildes erweitern
| Bevor Sie dieses Beispiel ausprobieren, führen Sie die Schritte im Abschnitt Vorbereitung dieser Anleitung aus, um Ihr Projekt und Ihre App einzurichten. |
Das folgende Beispiel zeigt, wie Sie ein Bild über seine ursprünglichen Grenzen hinaus erweitern . Dazu wird eine Maske verwendet, die in einem von Ihnen bereitgestellten Bild definiert ist. Sie stellen das Originalbild, einen Text-Prompt und das maskierte Bild bereit. Beachten Sie Folgendes zum Originalbild und zum maskierten Bild:
Das maskierte Bild muss die Pixelabmessungen der Zielgröße des endgültigen Outpainting-Bildes haben.
Das Originalbild muss zusätzlichen Abstand enthalten, damit es den Pixelabmessungen des maskierten Bildes entspricht.
Ein Text-Prompt ist optional, wenn das Modell intelligent entscheiden soll, wie die vorhandene Szene logisch fortgesetzt werden soll. Wenn Sie bestimmte Inhalte im erweiterten Bereich wünschen, müssen Sie diese in einem Text-Prompt angeben.
Swift
Die Bildbearbeitung mit Imagen Modellen wird für Swift nicht unterstützt. Schauen Sie später in diesem Jahr noch einmal vorbei.
Kotlin
Verwenden Sie
editImage()
, um ein Bild zu erweitern, und legen Sie die Bearbeitungskonfiguration so fest, dass ImagenEditMode.OUTPAINT verwendet wird.
Optional können Sie anstelle von editImage() auch
outpaintImage()
verwenden. In diesem Fall müssen Sie den Bearbeitungsmodus nicht angeben.
generateMaskAndPadForOutpainting()
In der Kurzanleitung finden Sie Beispielcode für Outpainting.
Java
Verwenden Sie
editImage()
, um ein Bild zu erweitern, und legen Sie die Bearbeitungskonfiguration so fest, dass ImagenEditMode.OUTPAINT verwendet wird.
Optional können Sie anstelle von editImage() auch
outpaintImage()
verwenden. In diesem Fall müssen Sie den Bearbeitungsmodus nicht angeben.
generateMaskAndPadForOutpainting()
In der Kurzanleitung finden Sie Beispielcode für Outpainting.
Web
Die Bildbearbeitung mit Imagen Modellen wird für Web-Apps nicht unterstützt. Schauen Sie später in diesem Jahr noch einmal vorbei.
Dart
Verwenden Sie
editImage(), um ein Bild zu erweitern, und legen Sie die Bearbeitungskonfiguration so fest, dass ImagenEditMode.OUTPAINT verwendet wird.
In der Kurzanleitung finden Sie Beispielcode für Outpainting.
Einheit
Die Bildbearbeitung mit Imagen Modellen wird für Unity nicht unterstützt. Schauen Sie später in diesem Jahr noch einmal vorbei.
Best Practices und Einschränkungen
Wir empfehlen, die Maske beim Bearbeiten eines Bildes zu erweitern. So lassen sich die Ränder einer Bearbeitung glätten und sie wirkt überzeugender. Im Allgemeinen wird ein Erweiterungswert von 1% oder 2% empfohlen (0.01 oder 0.02).
Feedback geben zu Ihren Erfahrungen mit Firebase AI Logic