Imagen की मदद से इमेज में बदलाव करने के बारे में खास जानकारी


यह सुविधा सिर्फ़ तब उपलब्ध होती है, जब Vertex AI Gemini API को एपीआई उपलब्ध कराने वाली सेवा के तौर पर इस्तेमाल किया जा रहा हो.


Firebase AI Logic एसडीके की मदद से, आपको Imagen मॉडल का ऐक्सेस मिलता है. यह ऐक्सेस आपको Imagen एपीआई के ज़रिए मिलता है. इससे, इन दोनों में से किसी एक का इस्तेमाल करके इमेज में बदलाव किया जा सकता है:

  • मास्क के आधार पर बदलाव करना. जैसे, ऑब्जेक्ट डालना और हटाना, इमेज के कॉन्टेंट को ओरिजनल बॉर्डर से आगे बढ़ाना, और बैकग्राउंड बदलना

  • स्टाइल (जैसे, पैटर्न, बनावट या कलाकार की स्टाइल), विषय (जैसे, प्रॉडक्ट, व्यक्ति या जानवर) या कंट्रोल (जैसे, हाथ से बनाया गया स्केच) के आधार पर, पसंद के मुताबिक बनाने के विकल्प.

इस पेज पर, बदलाव करने के हर विकल्प के बारे में सामान्य जानकारी दी गई है. हर विकल्प का अपना अलग पेज होता है. इस पेज पर, ज़्यादा जानकारी और कोड के सैंपल दिए जाते हैं.

इस सुविधा के साथ काम करने वाले मॉडल

Imagen, capability मॉडल के ज़रिए इमेज में बदलाव करने की सुविधा देता है:

  • imagen-3.0-capability-001

ध्यान दें कि Imagen मॉडल के लिए, global लोकेशन की जानकारी नहीं दी जा सकती.

मास्क के आधार पर बदलाव करना

मास्क के आधार पर बदलाव करने की सुविधा की मदद से, किसी इमेज के चुनिंदा हिस्से में सटीक बदलाव किए जा सकते हैं. मॉडल, इमेज के सिर्फ़ मास्क किए गए हिस्से में बदलाव करता है. मास्क एक डिजिटल ओवरले होता है. यह उस खास हिस्से को तय करता है जिसमें आपको बदलाव करना है. मास्क किए गए हिस्से का पता मॉडल अपने-आप लगा सकता है और उसे बना सकता है. इसके अलावा, इसे मास्क की गई उस इमेज में भी तय किया जा सकता है जिसे आपने उपलब्ध कराया है. इस्तेमाल के उदाहरण के आधार पर, मॉडल को यह जानने के लिए टेक्स्ट प्रॉम्प्ट की ज़रूरत पड़ सकती है कि क्या बदलाव करने हैं.

मास्क के आधार पर की जाने वाली एडिटिंग के कुछ सामान्य उदाहरण यहां दिए गए हैं:

ऑब्जेक्ट शामिल करना (इमेज के कुछ हिस्से को बदलना)

इमेज में ऑब्जेक्ट डालने के लिए, इनपेंटिंग का इस्तेमाल किया जा सकता है.

यह सुविधा कैसे काम करती है: आपको एक ओरिजनल इमेज और उससे जुड़ी एक मास्क की गई इमेज देनी होती है. यह इमेज अपने-आप जनरेट हो सकती है या आपको इसे उपलब्ध कराना होता है. इस इमेज में, उस जगह पर मास्क तय किया जाता है जहां आपको नया कॉन्टेंट जोड़ना है. आपको जो भी जोड़ना है उसके बारे में बताने वाला टेक्स्ट प्रॉम्प्ट भी दिया जा सकता है. इसके बाद, मॉडल मास्क किए गए हिस्से में नया कॉन्टेंट जनरेट करके जोड़ देता है.

उदाहरण के लिए, किसी टेबल को मास्क किया जा सकता है और मॉडल को फूलों का एक गुलदस्ता जोड़ने के लिए कहा जा सकता है.

ऑब्जेक्ट हटाना (इनपेंटिंग)

इनपेंटिंग का इस्तेमाल करके, किसी इमेज से ऑब्जेक्ट हटाए जा सकते हैं.

यह सुविधा कैसे काम करती है: आपको एक ओरिजनल इमेज और उससे जुड़ी मास्क की गई इमेज देनी होती है. यह इमेज, अपने-आप जनरेट होती है या इसे आपको देना होता है. इसमें उस ऑब्जेक्ट या सब्जेक्ट पर मास्क तय किया जाता है जिसे आपको हटाना है. आपके पास यह विकल्प भी है कि आप टेक्स्ट प्रॉम्प्ट में यह बताएं कि आपको क्या हटाना है. इसके अलावा, मॉडल यह भी पता लगा सकता है कि किस ऑब्जेक्ट को हटाना है. इसके बाद, मॉडल ऑब्जेक्ट को हटा देता है और उस जगह पर कॉन्टेक्स्ट के हिसाब से नया कॉन्टेंट भर देता है.

उदाहरण के लिए, किसी गेंद को मास्क किया जा सकता है और उसकी जगह खाली दीवार या घास का मैदान दिखाया जा सकता है.

किसी इमेज को उसके ओरिजनल बॉर्डर से आगे बढ़ाना (आउटपेंटिंग)

आउटपेंटिंग का इस्तेमाल करके, किसी इमेज को उसके ओरिजनल बॉर्डर से बाहर तक बढ़ाया जा सकता है.

यह कैसे काम करता है: आपको एक ओरिजनल इमेज और उससे जुड़ी एक मास्क्ड इमेज देनी होती है. यह इमेज, अपने-आप जनरेट होती है या इसे आपको देना होता है. इसमें नई, बड़ी की गई इमेज का मास्क तय किया जाता है. आपके पास यह बताने के लिए टेक्स्ट प्रॉम्प्ट देने का विकल्प भी है कि आपको बढ़ाए गए हिस्से में क्या चाहिए. इसके अलावा, मॉडल यह भी तय कर सकता है कि मौजूदा सीन को लॉजिक के हिसाब से आगे बढ़ाने के लिए क्या सही होगा. मॉडल, नया कॉन्टेंट जनरेट करता है और मास्क की गई जगह को भरता है.

उदाहरण के लिए, किसी इमेज का आसपेक्ट रेशियो बदला जा सकता है या बैकग्राउंड के बारे में ज़्यादा जानकारी जोड़ी जा सकती है.

बैकग्राउंड बदलना

किसी इमेज का बैकग्राउंड बदला जा सकता है.

यह कैसे काम करता है: आपको ओरिजनल इमेज और उससे मिलती-जुलती मास्क की गई इमेज देनी होती है. मास्क की गई इमेज में, बैकग्राउंड पर मास्क तय किया जाता है. इसके लिए, बैकग्राउंड का अपने-आप पता लगाने वाली सुविधा का इस्तेमाल किया जाता है या बैकग्राउंड का मास्क खुद दिया जाता है. आपको यह भी बताना होगा कि आपको किस तरह का बदलाव करना है. इसके लिए, आपको एक टेक्स्ट प्रॉम्प्ट देना होगा. इसके बाद, मॉडल एक नया बैकग्राउंड जनरेट करता है और उसे लागू करता है.

उदाहरण के लिए, किसी विषय या ऑब्जेक्ट के आस-पास की सेटिंग को बदला जा सकता है. इससे फ़ोरग्राउंड (जैसे, किसी प्रॉडक्ट की इमेज) पर कोई असर नहीं पड़ता.

कस्टमाइज़ेशन

पसंद के मुताबिक बनाना सुविधा की मदद से, टेक्स्ट प्रॉम्प्ट और रेफ़रंस इमेज का इस्तेमाल करके इमेज में बदलाव किया जा सकता है या नई इमेज जनरेट की जा सकती है. रेफ़रंस इमेज से मॉडल को यह जानकारी मिलती है कि उसे स्टाइल, विषय (जैसे कि कोई प्रॉडक्ट, व्यक्ति या जानवर) या कंट्रोल के आधार पर नई इमेज जनरेट करनी है.

किसी स्टाइल के आधार पर पसंद के मुताबिक बनाना

आपके पास किसी स्टाइल के आधार पर, इमेज में बदलाव करने या उन्हें जनरेट करने का विकल्प होता है.

यह कैसे काम करता है: आपको एक टेक्स्ट प्रॉम्प्ट और कम से कम एक रेफ़रंस इमेज देनी होती है. इससे किसी खास स्टाइल (जैसे कि पैटर्न, बनावट या डिज़ाइन स्टाइल) का पता चलता है. मॉडल इन इनपुट का इस्तेमाल करके, नई इमेज जनरेट करता है. यह इमेज, रेफ़रंस इमेज में बताई गई स्टाइल के हिसाब से होती है.

उदाहरण के लिए, आपको लोकप्रिय खुदरा कैटलॉग से मिली किसी इमेज के आधार पर, किचन की नई इमेज जनरेट की जा सकती है.

किसी विषय के आधार पर पसंद के मुताबिक बनाना

आपके पास किसी विषय के आधार पर इमेज में बदलाव करने या उन्हें जनरेट करने का विकल्प है.

यह कैसे काम करता है: आपको एक टेक्स्ट प्रॉम्प्ट और कम से कम एक रेफ़रंस इमेज देनी होती है. इसमें किसी खास विषय (जैसे, कोई प्रॉडक्ट, व्यक्ति या पालतू जानवर) को दिखाया गया हो. मॉडल इन इनपुट का इस्तेमाल करके, नई इमेज जनरेट करता है. यह इमेज, रेफ़रंस इमेज में दिए गए विषय पर आधारित होती है.

उदाहरण के लिए, मॉडल से किसी बच्चे की फ़ोटो को कार्टून स्टाइल में बदलने या किसी तस्वीर में मौजूद साइकल का रंग बदलने के लिए कहा जा सकता है.

किसी कंट्रोल के आधार पर पसंद के मुताबिक बनाना

आपके पास कंट्रोल के आधार पर, इमेज में बदलाव करने या उन्हें जनरेट करने का विकल्प होता है.

यह कैसे काम करता है: आपको एक टेक्स्ट प्रॉम्प्ट और कम से कम एक कंट्रोल रेफ़रंस इमेज (जैसे कि कोई ड्राइंग या कैन्यी एज इमेज) देनी होगी. मॉडल, इन इनपुट का इस्तेमाल करके कंट्रोल इमेज के आधार पर नई इमेज जनरेट करता है.

उदाहरण के लिए, मॉडल को रॉकेट शिप और चांद की ड्राइंग के साथ-साथ टेक्स्ट प्रॉम्प्ट दिया जा सकता है. इससे मॉडल, ड्राइंग के आधार पर वॉटरकलर पेंटिंग बना सकता है.


Firebase AI Logic के साथ अपने अनुभव के बारे में सुझाव/राय दें या शिकायत करें