Gemini API का इस्तेमाल करके, मल्टीमोडल प्रॉम्प्ट से टेक्स्ट जनरेट करें


'Firebase के लिए Vertex AI' SDK टूल का इस्तेमाल करके, अपने ऐप्लिकेशन से Gemini API को कॉल करते समय, Gemini मॉडल को मल्टीमोडल इनपुट के आधार पर टेक्स्ट जनरेट करने के लिए प्रॉम्प्ट जनरेट किया जा सकता है. मल्टीमोडल प्रॉम्प्ट में कई मोडलिटी (या इनपुट के टाइप) शामिल हो सकती हैं. जैसे, टेक्स्ट के साथ इमेज, PDF, वीडियो, और ऑडियो.

मल्टीमॉडल प्रॉम्प्ट की जांच करने और उन्हें फिर से चालू करने के लिए, हमारा सुझाव है कि आप Vertex AI Studio का इस्तेमाल करें.

वेब कंटेनर इंस्टॉल करने से पहले

अगर आपने अभी तक इस टूल को इस्तेमाल नहीं किया है, तो Firebase के लिए Vertex AI SDK टूल के बारे में शुरुआती जानकारी देने वाली गाइड को पढ़ें. पक्का करें कि आपने ये सभी काम कर लिए हों:

  • कोई नया या मौजूदा Firebase प्रोजेक्ट सेट अप करें. इसमें, ब्लेज़ प्राइसिंग प्लान का इस्तेमाल करना और ज़रूरी एपीआई चालू करना शामिल है.

  • अपने ऐप्लिकेशन को Firebase से कनेक्ट करें. इसमें, ऐप्लिकेशन रजिस्टर करना और ऐप्लिकेशन में Firebase कॉन्फ़िगरेशन जोड़ना भी शामिल है.

  • SDK टूल जोड़ें और अपने ऐप्लिकेशन में Vertex AI सेवा और जनरेटिव मॉडल का इस्तेमाल शुरू करें.

अपने ऐप्लिकेशन को Firebase से कनेक्ट करने, SDK टूल जोड़ने, और Vertex AI सेवा और जनरेटिव मॉडल शुरू करने के बाद, Gemini API को कॉल किया जा सकता है.

टेक्स्ट और किसी एक इमेज से टेक्स्ट जनरेट करें

इस सैंपल को आज़माने से पहले, पक्का करें कि आपने इस गाइड के शुरू करने से पहले वाले सेक्शन को पूरा कर लिया हो.

Gemini API को मल्टीमॉडल प्रॉम्प्ट की मदद से कॉल किया जा सकता है. इसमें टेक्स्ट और एक फ़ाइल, दोनों शामिल होते हैं. जैसे, इमेज, जैसा कि इस उदाहरण में दिखाया गया है. इन कॉल के लिए, आपको ऐसे मॉडल का इस्तेमाल करना होगा जिस पर मल्टीमोडल प्रॉम्प्ट की सुविधा काम करती हो. जैसे, Gemini 1.5 Pro.

फ़ाइलों में इमेज, PDF, वीडियो, ऑडियो वगैरह शामिल होते हैं. इनपुट फ़ाइलों से जुड़ी ज़रूरी शर्तों और सुझावों को ज़रूर देखें.

चुनें कि आपको जवाब को स्ट्रीम करना है (generateContentStream) या पूरा नतीजा जनरेट होने तक जवाब का इंतज़ार करना है (generateContent).

स्ट्रीमिंग

अगर आपको मॉडल जनरेशन के पूरे नतीजे का इंतज़ार नहीं करना है, तो आपके इंटरैक्शन तेज़ी से होने की संभावना बढ़ जाती है. इसके बजाय, आंशिक नतीजों को मैनेज करने के लिए, स्ट्रीमिंग का इस्तेमाल किया जा सकता है.

इस उदाहरण में, टेक्स्ट और एक इमेज वाले मल्टीमोडल प्रॉम्प्ट अनुरोध की मदद से, जनरेट किए गए टेक्स्ट को स्ट्रीम करने के लिए, generateContentStream() का इस्तेमाल करने का तरीका बताया गया है:

बिना स्ट्रीमिंग के

इसके अलावा, स्ट्रीम करने के बजाय पूरे नतीजे का इंतज़ार किया जा सकता है. नतीजों को तब ही दिखाया जाता है, जब मॉडल पूरी जनरेशन प्रोसेस पूरी कर लेता है.

इस उदाहरण में, टेक्स्ट और एक इमेज वाले मल्टीमोडल प्रॉम्प्ट अनुरोध से टेक्स्ट जनरेट करने के लिए, generateContent() का इस्तेमाल करने का तरीका बताया गया है:

Gemini का मॉडल चुनने का तरीक़ा जानें. साथ ही, आपके लिए इस्तेमाल के उदाहरण और ऐप्लिकेशन के लिए सही जगह की जानकारी चुनने का तरीक़ा जानें.

टेक्स्ट और एक से ज़्यादा इमेज से टेक्स्ट जनरेट करें

इस सैंपल को आज़माने से पहले, पक्का करें कि आपने इस गाइड के शुरू करने से पहले वाले सेक्शन को पूरा कर लिया हो.

Gemini API को मल्टीमॉडल प्रॉम्प्ट की मदद से कॉल किया जा सकता है. इसमें टेक्स्ट और कई फ़ाइलें शामिल होती हैं. जैसे, इमेज, जैसा कि इस उदाहरण में दिखाया गया है. इन कॉल के लिए, आपको ऐसे मॉडल का इस्तेमाल करना होगा जिस पर मल्टीमोडल प्रॉम्प्ट की सुविधा काम करती हो. जैसे, Gemini 1.5 Pro.

फ़ाइलों में इमेज, PDF, वीडियो, ऑडियो वगैरह शामिल होते हैं. इनपुट फ़ाइलों से जुड़ी ज़रूरी शर्तों और सुझावों को ज़रूर देखें.

चुनें कि आपको जवाब को स्ट्रीम करना है (generateContentStream) या पूरा नतीजा जनरेट होने तक जवाब का इंतज़ार करना है (generateContent).

स्ट्रीमिंग

अगर आपको मॉडल जनरेशन के पूरे नतीजे का इंतज़ार नहीं करना है, तो आपके इंटरैक्शन तेज़ी से होने की संभावना बढ़ जाती है. इसके बजाय, आंशिक नतीजों को मैनेज करने के लिए, स्ट्रीमिंग का इस्तेमाल किया जा सकता है.

इस उदाहरण में, टेक्स्ट और एक से ज़्यादा इमेज वाले मल्टीमोडल प्रॉम्प्ट अनुरोध की मदद से, जनरेट किए गए टेक्स्ट को स्ट्रीम करने के लिए, generateContentStream() का इस्तेमाल करने का तरीका बताया गया है:

बिना स्ट्रीमिंग के

इसके अलावा, स्ट्रीमिंग के बजाय पूरे नतीजे का इंतज़ार किया जा सकता है. जब मॉडल पूरी प्रोसेस पूरी कर लेता है, तब ही यह नतीजा मिलता है.

इस उदाहरण में, टेक्स्ट और एक से ज़्यादा इमेज वाले मल्टीमोडल प्रॉम्प्ट अनुरोध से टेक्स्ट जनरेट करने के लिए, generateContent() का इस्तेमाल करने का तरीका बताया गया है:

Gemini का मॉडल चुनने का तरीक़ा जानें. साथ ही, आपके लिए इस्तेमाल के उदाहरण और ऐप्लिकेशन के लिए सही जगह की जानकारी चुनने का तरीक़ा जानें.

टेक्स्ट और वीडियो से टेक्स्ट जनरेट करना

इस सैंपल को आज़माने से पहले, पक्का करें कि आपने इस गाइड के शुरू करने से पहले वाले सेक्शन को पूरा कर लिया हो.

Gemini API को मल्टीमोडल प्रॉम्प्ट के ज़रिए कॉल किया जा सकता है. इसमें टेक्स्ट और एक वीडियो, दोनों शामिल होते हैं. जैसा कि इस उदाहरण में दिखाया गया है. इन कॉल के लिए, आपको ऐसे मॉडल का इस्तेमाल करना होगा जिस पर मल्टीमोडल प्रॉम्प्ट की सुविधा काम करती हो. जैसे, Gemini 1.5 Pro.

इनपुट फ़ाइलों से जुड़ी ज़रूरी शर्तों और सुझावों को ज़रूर देखें.

चुनें कि आपको जवाब को स्ट्रीम करना है (generateContentStream) या पूरा नतीजा जनरेट होने तक जवाब का इंतज़ार करना है (generateContent).

स्ट्रीमिंग

अगर आपको मॉडल जनरेशन के पूरे नतीजे का इंतज़ार नहीं करना है, तो आपके इंटरैक्शन तेज़ी से होने की संभावना बढ़ जाती है. इसके बजाय, आंशिक नतीजों को मैनेज करने के लिए, स्ट्रीमिंग का इस्तेमाल किया जा सकता है.

इस उदाहरण में, टेक्स्ट और एक वीडियो वाले मल्टीमॉडल प्रॉम्प्ट अनुरोध की मदद से, जनरेट किए गए टेक्स्ट को स्ट्रीम करने के लिए, generateContentStream() का इस्तेमाल करने का तरीका बताया गया है:

बिना स्ट्रीमिंग के

इसके अलावा, स्ट्रीम करने के बजाय पूरे नतीजे का इंतज़ार किया जा सकता है. नतीजों को तब ही दिखाया जाता है, जब मॉडल पूरी जनरेशन प्रोसेस पूरी कर लेता है.

इस उदाहरण में, टेक्स्ट और एक वीडियो वाले मल्टीमोडल प्रॉम्प्ट अनुरोध से टेक्स्ट जनरेट करने के लिए, generateContent() का इस्तेमाल करने का तरीका बताया गया है:

Gemini का मॉडल चुनने का तरीक़ा जानें. साथ ही, आपके लिए इस्तेमाल के उदाहरण और ऐप्लिकेशन के लिए सही जगह की जानकारी चुनने का तरीक़ा जानें.

इनपुट फ़ाइलों के लिए ज़रूरी शर्तें और सुझाव

इस्तेमाल किए जा सकने वाले फ़ाइल टाइप, MIME टाइप की जानकारी देने, और यह पक्का करने का तरीका कि आपकी फ़ाइलें और मल्टीमोडल अनुरोध ज़रूरी शर्तों को पूरा करते हैं या नहीं, यह जानने के लिए और सबसे सही तरीकों का पालन करने के बारे में जानने के लिए, Vertex AI Gemini API के लिए काम करने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें देखें.

तुम और क्या कर सकती हो?

Gemini API की अन्य सुविधाएँ आज़माएँ

कॉन्टेंट जनरेट करने की प्रोसेस को कंट्रोल करने का तरीका जानें

Vertex AI Studio का इस्तेमाल करके, प्रॉम्प्ट और मॉडल कॉन्फ़िगरेशन के साथ भी एक्सपेरिमेंट किया जा सकता है.

Gemini के मॉडल के बारे में ज़्यादा जानें

अलग-अलग तरह के इस्तेमाल के लिए उपलब्ध मॉडल और उनके कोटा और कीमत के बारे में जानें.


Firebase के लिए Vertex AI के साथ अपने अनुभव के बारे में सुझाव/राय दें या शिकायत करें