Imagen का इस्तेमाल करके, इमेज से ऑब्जेक्ट हटाना


इस पेज पर, Firebase AI Logic एसडीके टूल का इस्तेमाल करके, Imagen की मदद से इनपेंटिंग का इस्तेमाल करने का तरीका बताया गया है. इससे किसी इमेज से ऑब्जेक्ट हटाया जा सकता है.

इनपेंटिंग, मास्क के आधार पर की जाने वाली एडिटिंग का एक टाइप है. मास्क एक डिजिटल ओवरले होता है. यह उस खास हिस्से को तय करता है जिसमें आपको बदलाव करना है.

यह सुविधा कैसे काम करती है: आपको एक ओरिजनल इमेज और उससे जुड़ी मास्क की गई इमेज देनी होती है. यह इमेज, अपने-आप जनरेट होती है या इसे आपको देना होता है. इसमें उस ऑब्जेक्ट या सब्जेक्ट पर मास्क तय किया जाता है जिसे आपको हटाना है. आपके पास यह विकल्प भी है कि आप टेक्स्ट प्रॉम्प्ट में यह बताएं कि आपको क्या हटाना है. इसके अलावा, मॉडल यह भी पता लगा सकता है कि किस ऑब्जेक्ट को हटाना है. इसके बाद, मॉडल ऑब्जेक्ट को हटा देता है और उस जगह पर कॉन्टेक्स्ट के हिसाब से नया कॉन्टेंट भर देता है.

उदाहरण के लिए, किसी गेंद को मास्क किया जा सकता है और उसकी जगह खाली दीवार या घास का मैदान दिखाया जा सकता है.

अपने-आप जनरेट होने वाले मास्क के कोड पर जाएं मास्क उपलब्ध कराने के कोड पर जाएं

शुरू करने से पहले

यह सुविधा सिर्फ़ तब उपलब्ध होती है, जब Vertex AI Gemini API को एपीआई उपलब्ध कराने वाली सेवा के तौर पर इस्तेमाल किया जा रहा हो.

अगर आपने अब तक शुरुआती गाइड नहीं पढ़ी है, तो इसे पढ़ें. इसमें बताया गया है कि Firebase प्रोजेक्ट कैसे सेट अप करें, अपने ऐप्लिकेशन को Firebase से कैसे कनेक्ट करें, एसडीके कैसे जोड़ें, चुने गए एपीआई उपलब्ध कराने वाली कंपनी के लिए बैकएंड सेवा को कैसे शुरू करें, और ImagenModel इंस्टेंस कैसे बनाएं.

इस सुविधा के साथ काम करने वाले मॉडल

Imagen, capability मॉडल के ज़रिए इमेज में बदलाव करने की सुविधा देता है:

  • imagen-3.0-capability-001

ध्यान दें कि Imagen मॉडल के लिए, global लोकेशन की जानकारी नहीं दी जा सकती.

अपने-आप जनरेट हुए मास्क का इस्तेमाल करके ऑब्जेक्ट हटाना

इस सैंपल को आज़माने से पहले, इस गाइड के शुरू करने से पहले सेक्शन में दिए गए निर्देशों का पालन करके, अपना प्रोजेक्ट और ऐप्लिकेशन सेट अप करें.

यहां दिए गए सैंपल में, अपने-आप मास्क जनरेट होने की सुविधा का इस्तेमाल करके, किसी इमेज से कॉन्टेंट हटाने के लिए इनपेंटिंग का इस्तेमाल करने का तरीका बताया गया है. आपको ओरिजनल इमेज और टेक्स्ट प्रॉम्प्ट देना होता है. इसके बाद, Imagen ओरिजनल इमेज में बदलाव करने के लिए, अपने-आप मास्क एरिया का पता लगाता है और उसे बनाता है.

Swift

Swift के लिए, Imagen मॉडल की मदद से इमेज में बदलाव करने की सुविधा उपलब्ध नहीं है. इस साल के आखिर में फिर से देखें!

Kotlin

अपने-आप जनरेट हुए मास्क की मदद से ऑब्जेक्ट हटाने के लिए, ImagenBackgroundMask तय करें. editImage() का इस्तेमाल करें और ImagenEditMode.INPAINT_REMOVAL का इस्तेमाल करने के लिए, एडिटिंग कॉन्फ़िगरेशन सेट करें.

// Using this SDK to access Imagen models is a Preview release and requires opt-in
@OptIn(PublicPreviewAPI::class)
suspend fun customizeImage() {
    // Initialize the Vertex AI Gemini API backend service
    // Optionally specify the location to access the model (for example, `us-central1`)
    val ai = Firebase.ai(backend = GenerativeBackend.vertexAI(location = "us-central1"))

    // Create an `ImagenModel` instance with an Imagen "capability" model
    val model = ai.imagenModel("imagen-3.0-capability-001")

    // This example assumes 'originalImage' is a pre-loaded Bitmap.
    // In a real app, this might come from the user's device or a URL.
    val originalImage: Bitmap = TODO("Load your original image Bitmap here")

    // Provide the prompt describing the content to be removed.
    val prompt = "ball"

    // Use the editImage API to remove the unwanted content.
    // Pass the original image, the prompt, and an editing configuration.
    val editedImage = model.editImage(
        sources = listOf(
            ImagenRawImage(originalImage),
            ImagenBackgroundMask(), // Use ImagenBackgroundMask() to auto-generate the mask.
        ),
        prompt = prompt,
        // Define the editing configuration for inpainting and insertion.
        config = ImagenEditingConfig(ImagenEditMode.INPAINT_REMOVAL)
    )

    // Process the resulting 'editedImage' Bitmap, for example, by displaying it in an ImageView.
}

Java

अपने-आप जनरेट हुए मास्क की मदद से ऑब्जेक्ट हटाने के लिए, ImagenBackgroundMask तय करें. editImage() का इस्तेमाल करें और ImagenEditMode.INPAINT_REMOVAL का इस्तेमाल करने के लिए, एडिटिंग कॉन्फ़िगरेशन सेट करें.

// Initialize the Vertex AI Gemini API backend service
// Optionally specify the location to access the model (for example, `us-central1`)
// Create an `ImagenModel` instance with an Imagen "capability" model
ImagenModel imagenModel = FirebaseAI.getInstance(GenerativeBackend.vertexAI("us-central1"))
        .imagenModel(
                /* modelName */ "imagen-3.0-capability-001");

ImagenModelFutures model = ImagenModelFutures.from(imagenModel);

// This example assumes 'originalImage' is a pre-loaded Bitmap.
// In a real app, this might come from the user's device or a URL.
Bitmap originalImage = null; // TODO("Load your image Bitmap here");

// Provide the prompt describing the content to be removed.
String prompt = "ball";

// Define the list of sources for the editImage call.
// This includes the original image and the auto-generated mask.
ImagenRawImage rawOriginalImage = new ImagenRawImage(originalImage);
ImagenBackgroundMask rawMaskedImage = new ImagenBackgroundMask();  // Use ImagenBackgroundMask() to auto-generate the mask.

// Define the editing configuration for inpainting and removal.
ImagenEditingConfig config = new ImagenEditingConfig.Builder()
        .setEditMode(ImagenEditMode.INPAINT_REMOVAL)
        .build();

// Use the editImage API to remove the unwanted content.
// Pass the original image, the auto-generated masked image, the prompt, and an editing configuration.
Futures.addCallback(model.editImage(Arrays.asList(rawOriginalImage, rawMaskedImage), prompt, config), new FutureCallback<ImagenGenerationResponse>() {
    @Override
    public void onSuccess(ImagenGenerationResponse result) {
        if (result.getImages().isEmpty()) {
            Log.d("ImageEditor", "No images generated");
        }
        Bitmap editedImage = result.getImages().get(0).asBitmap();
        // Process and use the bitmap to display the image in your UI
    }

    @Override
    public void onFailure(Throwable t) {
        // ...
    }
}, Executors.newSingleThreadExecutor());

Web

Imagen मॉडल की मदद से इमेज में बदलाव करने की सुविधा, वेब ऐप्लिकेशन के लिए उपलब्ध नहीं है. इस साल के आखिर में फिर से देखें!

Dart

अपने-आप जनरेट हुए मास्क की मदद से ऑब्जेक्ट हटाने के लिए, ImagenBackgroundMask तय करें. editImage() का इस्तेमाल करें और ImagenEditMode.inpaintRemoval का इस्तेमाल करने के लिए, एडिटिंग कॉन्फ़िगरेशन सेट करें.

import 'dart:typed_data';
import 'package:firebase_ai/firebase_ai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';

// Initialize FirebaseApp
await Firebase.initializeApp(
  options: DefaultFirebaseOptions.currentPlatform,
);

// Initialize the Vertex AI Gemini API backend service
// Optionally specify a location to access the model (for example, `us-central1`)
final ai = FirebaseAI.vertexAI(location: 'us-central1');

// Create an `ImagenModel` instance with an Imagen "capability" model
final model = ai.imagenModel(model: 'imagen-3.0-capability-001');

TODO - FLUTTER// This example assumes 'originalImage' is a pre-loaded Uint8List.
// In a real app, this might come from the user's device or a URL.
final Uint8List originalImage = Uint8List(0); // TODO: Load your original image data here.

// Provide the prompt describing the content to be removed.
final prompt = 'ball';

try {
  // Use the editImage API to remove the unwanted content.
  // Pass the original image, the prompt, and an editing configuration.
  final response = await model.editImage(
    sources: [
      ImagenRawImage(originalImage),
      ImagenBackgroundMask(),  // Use ImagenBackgroundMask() to auto-generate the mask.
    ],
    prompt,
    // Define the editing configuration for inpainting and removal.
    config: const ImagenEditingConfig(
      editMode: ImagenEditMode.inpaintRemoval,
    ),
  );

  // Process the result.
  if (response.images.isNotEmpty) {
    final editedImage = response.images.first.bytes;
    // Use the editedImage (a Uint8List) to display the image, save it, etc.
    print('Image successfully generated!');
  } else {
    // Handle the case where no images were generated.
    print('Error: No images were generated.');
  }
} catch (e) {
  // Handle any potential errors during the API call.
  print('An error occurred: $e');
}

Unity

Unity के लिए, Imagen मॉडल की मदद से इमेज में बदलाव करने की सुविधा काम नहीं करती. इस साल के आखिर में फिर से देखें!

दिए गए मास्क का इस्तेमाल करके ऑब्जेक्ट हटाना

इस सैंपल को आज़माने से पहले, इस गाइड के शुरू करने से पहले सेक्शन में दिए गए निर्देशों का पालन करके, अपना प्रोजेक्ट और ऐप्लिकेशन सेट अप करें.

यहां दिए गए सैंपल में, किसी इमेज से कॉन्टेंट हटाने के लिए इनपेंटिंग का इस्तेमाल करने का तरीका बताया गया है. इसके लिए, आपको अपनी इमेज में तय किया गया मास्क इस्तेमाल करना होगा. आपको ओरिजनल इमेज, टेक्स्ट प्रॉम्प्ट, और मास्क की गई इमेज देनी होती है.

अगर आपने मास्क की गई इमेज दी है, तो टेक्स्ट प्रॉम्प्ट देना ज़रूरी नहीं है. Imagen, मास्क की गई जगह से किसी ऑब्जेक्ट को हटाने के लिए, उसे आसानी से पहचान सकता है. हालांकि, अगर आपको जिस ऑब्जेक्ट को हटाना है वह साफ़ तौर पर नहीं दिख रहा है या आपको मास्क किए गए हिस्से में मौजूद सिर्फ़ कुछ ऑब्जेक्ट हटाने हैं, तो टेक्स्ट प्रॉम्प्ट दें. इससे मॉडल को सही ऑब्जेक्ट हटाने में मदद मिलेगी.

Swift

Swift के लिए, Imagen मॉडल की मदद से इमेज में बदलाव करने की सुविधा उपलब्ध नहीं है. इस साल के आखिर में फिर से देखें!

Kotlin

ऑब्जेक्ट हटाने और मास्किंग की गई अपनी इमेज देने के लिए, मास्किंग की गई इमेज के साथ ImagenRawMask तय करें. editImage() का इस्तेमाल करें और ImagenEditMode.INPAINT_REMOVAL का इस्तेमाल करने के लिए, एडिटिंग कॉन्फ़िगरेशन सेट करें.

// Using this SDK to access Imagen models is a Preview release and requires opt-in
@OptIn(PublicPreviewAPI::class)
suspend fun customizeImage() {
    // Initialize the Vertex AI Gemini API backend service
    // Optionally specify the location to access the model (for example, `us-central1`)
    val ai = Firebase.ai(backend = GenerativeBackend.vertexAI(location = "us-central1"))

    // Create an `ImagenModel` instance with an Imagen "capability" model
    val model = ai.imagenModel("imagen-3.0-capability-001")

    // This example assumes 'originalImage' is a pre-loaded Bitmap.
    // In a real app, this might come from the user's device or a URL.
    val originalImage: Bitmap = TODO("Load your original image Bitmap here")

    // This example assumes 'maskImage' is a pre-loaded Bitmap that contains the masked area.
    // In a real app, this might come from the user's device or a URL.
    val maskImage: Bitmap = TODO("Load your masked image Bitmap here")

    // Provide the prompt describing the content to be removed.
    val prompt = "ball"

    // Use the editImage API to remove the unwanted content.
    // Pass the original image, the masked image, the prompt, and an editing configuration.
    val editedImage = model.editImage(
        referenceImages = listOf(
            ImagenRawImage(originalImage.toImagenInlineImage()),
            ImagenRawMask(maskImage.toImagenInlineImage()), // Use ImagenRawMask() to provide your own masked image.
        ),
        prompt = prompt,
        // Define the editing configuration for inpainting and removal.
        config = ImagenEditingConfig(ImagenEditMode.INPAINT_REMOVAL)
    )

    // Process the resulting 'editedImage' Bitmap, for example, by displaying it in an ImageView.
}

Java

ऑब्जेक्ट हटाने और मास्किंग की गई अपनी इमेज देने के लिए, मास्किंग की गई इमेज के साथ ImagenRawMask तय करें. editImage() का इस्तेमाल करें और ImagenEditMode.INPAINT_REMOVAL का इस्तेमाल करने के लिए, एडिटिंग कॉन्फ़िगरेशन सेट करें.

// Initialize the Vertex AI Gemini API backend service
// Optionally specify the location to access the model (for example, `us-central1`)
// Create an `ImagenModel` instance with an Imagen "capability" model
ImagenModel imagenModel = FirebaseAI.getInstance(GenerativeBackend.vertexAI("us-central1"))
        .imagenModel(
                /* modelName */ "imagen-3.0-capability-001");

ImagenModelFutures model = ImagenModelFutures.from(imagenModel);

// This example assumes 'originalImage' is a pre-loaded Bitmap.
// In a real app, this might come from the user's device or a URL.
Bitmap originalImage = null; // TODO("Load your original image Bitmap here");

// This example assumes 'maskImage' is a pre-loaded Bitmap that contains the masked area.
// In a real app, this might come from the user's device or a URL.
Bitmap maskImage = null; // TODO("Load your masked image Bitmap here");

// Provide the prompt describing the content to be removed.
String prompt = "ball";

// Define the list of source images for the editImage call.
ImagenRawImage rawOriginalImage = new ImagenRawImage(originalImage);
ImagenBackgroundMask rawMaskedImage = new ImagenRawMask(maskImage); // Use ImagenRawMask() to provide your own masked image.

// Define the editing configuration for inpainting and removal.
ImagenEditingConfig config = new ImagenEditingConfig.Builder()
        .setEditMode(ImagenEditMode.INPAINT_REMOVAL)
        .build();

// Use the editImage API to remove the unwanted content.
// Pass the original image, the masked image, the prompt, and an editing configuration.
Futures.addCallback(model.editImage(Arrays.asList(rawOriginalImage, rawMaskedImage), prompt, config), new FutureCallback<ImagenGenerationResponse>() {
    @Override
    public void onSuccess(ImagenGenerationResponse result) {
        if (result.getImages().isEmpty()) {
            Log.d("ImageEditor", "No images generated");
        }
        Bitmap editedImage = result.getImages().get(0).asBitmap();
        // Process and use the bitmap to display the image in your UI
    }

    @Override
    public void onFailure(Throwable t) {
        // ...
    }
}, Executors.newSingleThreadExecutor());

Web

Imagen मॉडल की मदद से इमेज में बदलाव करने की सुविधा, वेब ऐप्लिकेशन के लिए उपलब्ध नहीं है. इस साल के आखिर में फिर से देखें!

Dart

ऑब्जेक्ट हटाने और मास्किंग की गई अपनी इमेज देने के लिए, मास्किंग की गई इमेज के साथ ImagenRawMask तय करें. editImage() का इस्तेमाल करें और ImagenEditMode.inpaintRemoval का इस्तेमाल करने के लिए, एडिटिंग कॉन्फ़िगरेशन सेट करें.

import 'dart:typed_data';
import 'package:firebase_ai/firebase_ai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';

// Initialize FirebaseApp
await Firebase.initializeApp(
  options: DefaultFirebaseOptions.currentPlatform,
);

// Initialize the Vertex AI Gemini API backend service
// Optionally specify a location to access the model (for example, `us-central1`)
final ai = FirebaseAI.vertexAI(location: 'us-central1');

// Create an `ImagenModel` instance with an Imagen "capability" model
final model = ai.imagenModel(model: 'imagen-3.0-capability-001');

// This example assumes 'originalImage' is a pre-loaded Uint8List.
// In a real app, this might come from the user's device or a URL.
final Uint8List originalImage = Uint8List(0); // TODO: Load your original image data here.

// This example assumes 'maskImage' is a pre-loaded Uint8List that contains the masked area.
// In a real app, this might come from the user's device or a URL.
final Uint8List maskImage = Uint8List(0); // TODO: Load your masked image data here.

// Provide the prompt describing the content to be removed.
final prompt = 'ball';

try {
  // Use the editImage API to remove the unwanted content.
  // Pass the original image, the prompt, and an editing configuration.
  final response = await model.editImage(
    sources: [
      ImagenRawImage(originalImage),
      ImagenRawMask(maskImage), // Use ImagenRawMask() to provide your own masked image.
    ],
    prompt: prompt,
    // Define the editing configuration for inpainting and removal.
    config: const ImagenEditingConfig(
      editMode: ImagenEditMode.inpaintRemoval,
    ),
  );

  // Process the result.
  if (response.images.isNotEmpty) {
    final editedImage = response.images.first.bytes;
    // Use the editedImage (a Uint8List) to display the image, save it, etc.
    print('Image successfully generated!');
  } else {
    // Handle the case where no images were generated.
    print('Error: No images were generated.');
  }
} catch (e) {
  // Handle any potential errors during the API call.
  print('An error occurred: $e');
}

Unity

Unity के लिए, Imagen मॉडल की मदद से इमेज में बदलाव करने की सुविधा काम नहीं करती. इस साल के आखिर में फिर से देखें!

सबसे सही तरीके और सीमाएं

हमारा सुझाव है कि इमेज में बदलाव करते समय, मास्क को बड़ा करें. इससे बदलाव के बॉर्डर को स्मूद करने में मदद मिलती है. साथ ही, बदलाव को ज़्यादा भरोसेमंद बनाया जा सकता है. आम तौर पर, डाइलेशन की वैल्यू 1% या 2% रखने का सुझाव दिया जाता है (0.01 या 0.02).


Firebase AI Logic के साथ अपने अनुभव के बारे में सुझाव/राय दें या शिकायत करें