Imagen की मदद से इमेज में बदलाव करने के बारे में खास जानकारी


यह सुविधा सिर्फ़ तब उपलब्ध होती है, जब Vertex AI Gemini API को एपीआई उपलब्ध कराने वाली कंपनी के तौर पर इस्तेमाल किया जा रहा हो.


Firebase AI Logic एसडीके की मदद से, आपको Imagen मॉडल का ऐक्सेस मिलता है. यह ऐक्सेस, Imagen एपीआई के ज़रिए मिलता है. इससे, इन दोनों में से किसी एक का इस्तेमाल करके इमेज में बदलाव किया जा सकता है:

  • मास्क-आधारित एडिटिंग. जैसे, ऑब्जेक्ट डालना और हटाना, इमेज के कॉन्टेंट को ओरिजनल बॉर्डर से बड़ा करना, और बैकग्राउंड बदलना

  • पसंद के मुताबिक बनाने के विकल्प, स्टाइल (जैसे, पैटर्न, बनावट या कलाकार की स्टाइल), विषय (जैसे, प्रॉडक्ट, व्यक्ति या जानवर) या कंट्रोल (जैसे, हाथ से बनाया गया स्केच) के आधार पर उपलब्ध होते हैं.

इस पेज पर, बदलाव करने के हर विकल्प के बारे में खास जानकारी दी गई है. हर विकल्प का अपना अलग पेज होता है. इस पेज पर, ज़्यादा जानकारी और कोड के सैंपल दिए जाते हैं.

इस सुविधा के साथ काम करने वाले मॉडल

Imagen अपने capability मॉडल के ज़रिए इमेज एडिटिंग की सुविधा देता है:

  • imagen-3.0-capability-001

ध्यान दें कि Imagen मॉडल के लिए, global लोकेशन की जानकारी नहीं दी जा सकती.

मास्क के आधार पर बदलाव करना

मास्क के आधार पर बदलाव करने की सुविधा की मदद से, किसी इमेज के चुनिंदा हिस्से में सटीक बदलाव किए जा सकते हैं. मॉडल, इमेज के सिर्फ़ उस मास्क किए गए हिस्से में बदलाव करता है जिसे आपने तय किया है. मास्क एक डिजिटल ओवरले होता है. यह उस खास हिस्से को तय करता है जिसमें आपको बदलाव करना है. मास्क किए गए हिस्से का पता मॉडल अपने-आप लगा सकता है और उसे बना सकता है. इसके अलावा, मास्क किए गए हिस्से को आपकी दी गई मास्क की गई इमेज में भी तय किया जा सकता है. इस्तेमाल के उदाहरण के आधार पर, मॉडल को यह जानने के लिए टेक्स्ट प्रॉम्प्ट की ज़रूरत पड़ सकती है कि क्या बदलाव करने हैं.

मास्क के आधार पर बदलाव करने की सुविधा के कुछ सामान्य इस्तेमाल के उदाहरण यहां दिए गए हैं:

ऑब्जेक्ट जोड़ना (इमेज के कुछ हिस्से को बदलना)

इनपेंटिंग की सुविधा का इस्तेमाल करके, किसी इमेज में ऑब्जेक्ट डाले जा सकते हैं.

यह कैसे काम करता है: आपको एक ओरिजनल इमेज और उससे जुड़ी मास्क की गई इमेज देनी होती है. यह इमेज अपने-आप जनरेट हो सकती है या इसे आपको उपलब्ध कराना होता है. यह इमेज, उस जगह पर मास्क तय करती है जहां आपको नया कॉन्टेंट जोड़ना है. आपको जो भी जोड़ना है उसके बारे में बताने वाला टेक्स्ट प्रॉम्प्ट भी दिया जा सकता है. इसके बाद, मॉडल मास्क की गई जगह पर नया कॉन्टेंट जनरेट करता है और उसे जोड़ देता है.

उदाहरण के लिए, किसी टेबल को मास्क किया जा सकता है और मॉडल को फूलों का गुलदस्ता जोड़ने के लिए कहा जा सकता है.

ऑब्जेक्ट हटाना (इनपेंटिंग)

इनपेंटिंग का इस्तेमाल करके, किसी इमेज से ऑब्जेक्ट हटाए जा सकते हैं.

यह कैसे काम करता है: आपको एक ओरिजनल इमेज और उससे जुड़ी मास्क की गई इमेज देनी होती है. यह इमेज, अपने-आप जनरेट होती है या इसे आपको देना होता है. इसमें उस ऑब्जेक्ट या सब्जेक्ट पर मास्क तय किया जाता है जिसे आपको हटाना है. आपके पास यह विकल्प भी है कि आपको इमेज से क्या हटाना है, इसके बारे में बताने वाला टेक्स्ट प्रॉम्प्ट दें. इसके अलावा, मॉडल यह भी पता लगा सकता है कि किस ऑब्जेक्ट को हटाना है. इसके बाद, मॉडल ऑब्जेक्ट को हटा देता है और उस जगह पर कॉन्टेक्स्ट के हिसाब से नया कॉन्टेंट भर देता है.

उदाहरण के लिए, किसी गेंद को मास्क करके, उसकी जगह खाली दीवार या घास का मैदान दिखाया जा सकता है.

किसी इमेज को उसके ओरिजनल बॉर्डर से बड़ा करना (आउटपेंटिंग)

आउटपेंटिंग की सुविधा का इस्तेमाल करके, किसी इमेज को उसके ओरिजनल बॉर्डर से बड़ा किया जा सकता है.

यह कैसे काम करता है: आपको एक ओरिजनल इमेज और उससे मिलती-जुलती मास्क्ड इमेज देनी होती है. यह इमेज, अपने-आप जनरेट हुई हो या आपने दी हो. इसमें नई और बड़ी की गई इमेज का मास्क तय किया जाता है. आपके पास यह बताने का विकल्प भी है कि आपको बढ़ाए गए हिस्से में क्या चाहिए. इसके लिए, टेक्स्ट प्रॉम्प्ट का इस्तेमाल करें. इसके अलावा, मॉडल यह भी तय कर सकता है कि मौजूदा सीन को लॉजिक के हिसाब से आगे बढ़ाने के लिए, क्या जनरेट करना सही रहेगा. मॉडल, नया कॉन्टेंट जनरेट करता है और मास्क की गई जगह में उसे भर देता है.

उदाहरण के लिए, किसी इमेज का आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) बदला जा सकता है या बैकग्राउंड के बारे में ज़्यादा जानकारी जोड़ी जा सकती है.

बैकग्राउंड बदलना

किसी इमेज का बैकग्राउंड बदला जा सकता है.

यह कैसे काम करता है: आपको ओरिजनल इमेज और उससे मिलती-जुलती मास्क की गई इमेज देनी होती है. मास्क की गई इमेज में, बैकग्राउंड पर मास्क तय किया जाता है. इसके लिए, बैकग्राउंड का अपने-आप पता लगाने वाली सुविधा का इस्तेमाल किया जाता है या बैकग्राउंड का मास्क खुद दिया जाता है. इसके अलावा, आपको यह भी बताना होगा कि आपको क्या बदलाव करने हैं. इसके लिए, एक टेक्स्ट प्रॉम्प्ट दें. इसके बाद, मॉडल एक नया बैकग्राउंड जनरेट करता है और उसे लागू करता है.

उदाहरण के लिए, किसी विषय या ऑब्जेक्ट के आस-पास की सेटिंग को बदला जा सकता है. इससे फ़ोरग्राउंड (जैसे, किसी प्रॉडक्ट की इमेज में) पर कोई असर नहीं पड़ता.

कस्टमाइज़ेशन

पसंद के मुताबिक बनाना सुविधा की मदद से, टेक्स्ट प्रॉम्प्ट और रेफ़रंस इमेज का इस्तेमाल करके इमेज में बदलाव किया जा सकता है या नई इमेज जनरेट की जा सकती है. रेफ़रंस इमेज से मॉडल को यह जानकारी मिलती है कि उसे स्टाइल, विषय (जैसे कि कोई प्रॉडक्ट, व्यक्ति या जानवर) या कंट्रोल के आधार पर नई इमेज जनरेट करनी है.

किसी स्टाइल के आधार पर पसंद के मुताबिक बनाना

आपके पास किसी स्टाइल के आधार पर, इमेज में बदलाव करने या उन्हें जनरेट करने का विकल्प होता है.

यह कैसे काम करता है: आपको एक टेक्स्ट प्रॉम्प्ट और कम से कम एक रेफ़रंस इमेज देनी होती है. इस इमेज में कोई खास स्टाइल (जैसे, पैटर्न, टेक्सचर या डिज़ाइन स्टाइल) दिखनी चाहिए. मॉडल इन इनपुट का इस्तेमाल करके, रेफ़रंस इमेज में बताई गई स्टाइल के आधार पर नई इमेज जनरेट करता है.

उदाहरण के लिए, आपको लोकप्रिय खुदरा कैटलॉग से मिली किसी इमेज के आधार पर, किचन की नई इमेज जनरेट की जा सकती है.

किसी विषय के आधार पर पसंद के मुताबिक बनाना

आपके पास किसी विषय के आधार पर, इमेज में बदलाव करने या उन्हें जनरेट करने का विकल्प होता है.

यह कैसे काम करता है: आपको एक टेक्स्ट प्रॉम्प्ट और कम से कम एक रेफ़रंस के लिए इमेज देनी होती है. इसमें किसी खास सब्जेक्ट (जैसे, कोई प्रॉडक्ट, व्यक्ति या पालतू जानवर) को दिखाया गया हो. मॉडल इन इनपुट का इस्तेमाल करके, रेफ़रंस इमेज में दिए गए विषय के आधार पर नई इमेज जनरेट करता है.

उदाहरण के लिए, मॉडल से किसी बच्चे की फ़ोटो को कार्टून स्टाइल में बदलने या किसी तस्वीर में मौजूद साइकल का रंग बदलने के लिए कहा जा सकता है.

किसी कंट्रोल के आधार पर पसंद के मुताबिक बनाना

आपके पास कंट्रोल के आधार पर, इमेज में बदलाव करने या उन्हें जनरेट करने का विकल्प होता है.

यह कैसे काम करता है: आपको एक टेक्स्ट प्रॉम्प्ट और कम से कम एक कंट्रोल रेफ़रंस के लिए इमेज (जैसे कि कोई ड्राइंग या कैन्यी एज इमेज) देनी होती है. मॉडल, इन इनपुट का इस्तेमाल करके कंट्रोल इमेज के आधार पर नई इमेज जनरेट करता है.

उदाहरण के लिए, मॉडल को रॉकेट शिप और चांद की ड्राइंग के साथ-साथ टेक्स्ट प्रॉम्प्ट दिया जा सकता है. इससे मॉडल, ड्राइंग के आधार पर वॉटरकलर पेंटिंग बना सकता है.


Firebase AI Logic के साथ अपने अनुभव के बारे में सुझाव/राय दें या शिकायत करें