मोबाइल और वेब ऐप्लिकेशन के लिए, Vertex AI in Firebase SDK टूल की मदद से, अपने ऐप्लिकेशन से सीधे तौर पर, काम करने वाले Gemini मॉडल के साथ इंटरैक्ट किया जा सकता है.
Gemini मॉडल को मल्टीमोडल माना जाता है, क्योंकि ये टेक्स्ट, कोड, PDF, इमेज, वीडियो, और ऑडियो जैसे कई मोड को प्रोसेस करने और जनरेट करने में सक्षम होते हैं.
यहां Vertex AI in Firebase के साथ काम करने वाले मॉडल और उनके सबसे नए वर्शन के बारे में खास जानकारी दी गई है. इस पेज पर आगे दिए गए सेक्शन में, तुलना और जानकारी के बारे में ज़्यादा जानकारी दी गई है.
मॉडल | इनपुट | आउटपुट | इनके लिए ऑप्टिमाइज़ किया गया |
---|---|---|---|
Gemini मॉडल | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON (इमेज और ऑडियो की सुविधा जल्द ही उपलब्ध होगी!) |
अलग-अलग तरह के कामों के लिए, अगली पीढ़ी की सुविधाएं, तेज़ी, और कई मोड में जनरेट करने की सुविधा |
Gemini 1.5 Progemini-1.5-pro-002 |
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | ऐसे जटिल काम जिनमें ज़्यादा बुद्धिमत्ता की ज़रूरत होती है |
Gemini 1.5 Flashgemini-1.5-flash-002 |
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस |
इस पेज के बाकी हिस्से में, Vertex AI in Firebase के साथ काम करने वाले मॉडल के बारे में पूरी जानकारी दी गई है:
-
- इस्तेमाल किए जा सकने वाले इनपुट और आउटपुट
- काम करने वाली सुविधाओं की खास जानकारी
- खास जानकारी और सीमाएं. उदाहरण के लिए, इनपुट टोकन की ज़्यादा से ज़्यादा संख्या या इनपुट वीडियो की ज़्यादा से ज़्यादा अवधि
मॉडल के वर्शन बनाने का तरीका, खास तौर पर उनके स्टैबल, अपने-आप अपडेट होने वाले, और झलक वाले वर्शन
उपलब्ध मॉडल के नामों की सूचियां, जिन्हें शुरू करने के दौरान अपने कोड में शामिल करना है
मॉडल के लिए इस्तेमाल की जा सकने वाली भाषाओं की सूचियां
इस पेज पर सबसे नीचे, पुराने मॉडल के बारे में ज़्यादा जानकारी देखी जा सकती है.
मॉडल की तुलना करना
हर मॉडल में अलग-अलग सुविधाएं होती हैं, ताकि अलग-अलग तरह के कामों में इस्तेमाल किया जा सके. ध्यान दें कि Vertex AI in Firebase के साथ इस्तेमाल करने पर, इस सेक्शन की हर टेबल में हर मॉडल के बारे में जानकारी दी जाती है. हर मॉडल में ऐसी अतिरिक्त सुविधाएं हो सकती हैं जो हमारे SDK टूल का इस्तेमाल करते समय उपलब्ध नहीं होतीं.
Google Cloud दस्तावेज़ में, Gemini मॉडल के बारे में ज़्यादा जानें.
इस्तेमाल किए जा सकने वाले इनपुट और आउटपुट
Vertex AI in Firebase के साथ हर मॉडल का इस्तेमाल करते समय, इनपुट और आउटपुट के ये टाइप इस्तेमाल किए जा सकते हैं:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
इनपुट टाइप | ||||
टेक्स्ट | ||||
कोड | ||||
दस्तावेज़ (PDF या सादा टेक्स्ट) | ||||
इमेज, वीडियो, और ऑडियो | ||||
ऑडियो (स्ट्रीमिंग) | जल्द ही उपलब्ध होगा! | |||
आउटपुट टाइप | ||||
टेक्स्ट | ||||
स्ट्रक्चर्ड आउटपुट (जैसे, JSON) | ||||
कोड | ||||
इमेज | जल्द ही उपलब्ध होगा! | |||
ऑडियो | जल्द ही उपलब्ध होगा! | |||
ऑडियो (स्ट्रीमिंग) | जल्द ही उपलब्ध होगा! |
इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, Vertex AI Gemini API के लिए इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें देखें.
इस्तेमाल की जा सकने वाली सुविधाएं और क्षमताएं
Vertex AI in Firebase के साथ हर मॉडल का इस्तेमाल करते समय, ये सुविधाएं और काम करने की क्षमताएं उपलब्ध होती हैं:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
टेक्स्ट या मल्टीमोडल इनपुट से टेक्स्ट जनरेट करना | ||||
इमेज जनरेट करें | जल्द ही उपलब्ध होगा! | |||
ऑडियो जनरेट करना | जल्द ही उपलब्ध होगा! | |||
JSON जैसे स्ट्रक्चर्ड आउटपुट जनरेट करना | ||||
इमेज और वीडियो का विश्लेषण करना (विज़न) | ||||
ऑडियो का विश्लेषण करना | ||||
दस्तावेज़ों (PDF या सादा टेक्स्ट) का विश्लेषण करना | ||||
मल्टी-टर्न चैट | ||||
फ़ंक्शन कॉल करना (टूल) | ||||
फ़ंक्शन को बुलाना | ||||
एक साथ कई फ़ंक्शन कॉल करना | ||||
फ़ंक्शन कॉलिंग मोड | ||||
टोकन और बिलिंग के लिए ज़रूरी वर्णों की गिनती करना | ||||
सिस्टम से जुड़े निर्देश | ||||
मल्टीमोडल लाइव एपीआई (दोतरफ़ा स्ट्रीमिंग) | जल्द ही उपलब्ध होगा! |
खास जानकारी और सीमाएं
Vertex AI in Firebase के साथ हर मॉडल का इस्तेमाल करते समय, ये खास बातें और सीमाएं लागू होती हैं:
प्रॉपर्टी | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
कॉन्टेक्स्ट विंडो * टोकन की कुल सीमा (इनपुट+आउटपुट को मिलाकर) |
1,048,576 टोकन | 2,097,152 टोकन | 1,048,576 टोकन |
आउटपुट टोकन की सीमा * | 8,192 टोकन | 8,192 टोकन | 8,192 टोकन |
नॉलेज कट्सऑफ़ की तारीख | जून 2024 | मई 2024 | मई 2024 |
इमेज (हर अनुरोध के लिए) | |||
इनपुट इमेज की ज़्यादा से ज़्यादा संख्या | 3,000 इमेज | 3,000 इमेज | 3,000 इमेज |
आउटपुट इमेज की ज़्यादा से ज़्यादा संख्या | जल्द ही उपलब्ध होगा! | --- | --- |
Base64 कोड में बदली गई हर इनपुट इमेज का ज़्यादा से ज़्यादा साइज़ | 7 एमबी | 7 एमबी | 7 एमबी |
PDF (हर अनुरोध के हिसाब से) | |||
इनपुट PDF फ़ाइलों की ज़्यादा से ज़्यादा संख्या ** | 3,000 फ़ाइलें | 3,000 फ़ाइलें | 3,000 फ़ाइलें |
हर इनपुट PDF फ़ाइल में पेजों की ज़्यादा से ज़्यादा संख्या ** | 1,000 पेज | 1,000 पेज | 1,000 पेज |
हर इनपुट PDF फ़ाइल का ज़्यादा से ज़्यादा साइज़ | 50 एमबी | 50 एमबी | 50 एमबी |
वीडियो (हर अनुरोध के हिसाब से) | |||
इनपुट वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या | 10 फ़ाइलें | 10 फ़ाइलें | 10 फ़ाइलें |
सभी इनपुट वीडियो की ज़्यादा से ज़्यादा लंबाई (सिर्फ़ फ़्रेम) | ~60 मिनट | ~60 मिनट | ~60 मिनट |
सभी इनपुट वीडियो (फ़्रेम+ऑडियो) की ज़्यादा से ज़्यादा अवधि | ~45 मिनट | ~45 मिनट | ~45 मिनट |
ऑडियो (हर अनुरोध के हिसाब से) | |||
इनपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या | 1 फ़ाइल | 1 फ़ाइल | 1 फ़ाइल |
आउटपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या | जल्द ही उपलब्ध होगा! | --- | --- |
सभी इनपुट ऑडियो की ज़्यादा से ज़्यादा अवधि | ~8.4 घंटे | ~8.4 घंटे | ~8.4 घंटे |
सभी आउटपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई | जल्द ही उपलब्ध होगा! | --- | --- |
* सभी मॉडल के लिए, एक टोकन करीब चार वर्णों के बराबर होता है. इसलिए, 100 टोकन करीब 60 से 80 अंग्रेज़ी शब्दों के बराबर होते हैं. Gemini मॉडल के लिए, countTokens
का इस्तेमाल करके, अपने अनुरोधों में टोकन की कुल संख्या तय की जा सकती है.
** PDF को इमेज के तौर पर माना जाता है. इसलिए, PDF के एक पेज को एक इमेज के तौर पर माना जाता है. अनुरोध में पेजों की संख्या, उन इमेज की संख्या तक सीमित होती है जिनके लिए मॉडल काम करता है.
ज़्यादा जानकारी पाना
हर मॉडल के लिए कोटा और कीमत अलग-अलग होती है. कीमत, इनपुट और आउटपुट पर भी निर्भर करती है.
इनपुट फ़ाइल के इस्तेमाल किए जा सकने वाले टाइप, एमआईएम टाइप तय करने के तरीके, और यह पक्का करने के तरीके के बारे में जानें कि आपकी इनपुट फ़ाइलें और कई मोड वाले अनुरोध, ज़रूरी शर्तों के मुताबिक हों और इनपुट फ़ाइलों के इस्तेमाल किए जा सकने वाले टाइप और Vertex AI Gemini API के लिए ज़रूरी शर्तों में बताए गए सबसे सही तरीकों का पालन करते हों.
मॉडल के वर्शन और नाम देने के पैटर्न
मॉडल, स्टैबल, अपने-आप अपडेट होने वाले, और झलक वर्शन में उपलब्ध होते हैं.
स्टैबल वर्शन को आम तौर पर उपलब्ध माना जाता है.
- स्टेबल वर्शन में, मॉडल के नाम के साथ तीन अंकों का वर्शन नंबर जोड़ा जाता है. उदाहरण के लिए,
.gemini-2.0-flash-001
- स्टेबल वर्शन में, मॉडल के नाम के साथ तीन अंकों का वर्शन नंबर जोड़ा जाता है. उदाहरण के लिए,
अपने-आप अपडेट होने वाले वर्शन, हमेशा उस मॉडल के नए स्टैबल वर्शन पर ले जाते हैं. अगर कोई नया स्टैबल वर्शन रिलीज़ किया जाता है, तो अपने-आप अपडेट होने वाला वर्शन, अपने-आप उस नए स्टैबल वर्शन पर ले जाता है.
- अपने-आप अपडेट होने वाले वर्शन में, मॉडल के नाम के साथ कोई ऐपेंडेज नहीं होता. उदाहरण के लिए,
.gemini-2.0-flash
- अपने-आप अपडेट होने वाले वर्शन में, मॉडल के नाम के साथ कोई ऐपेंडेज नहीं होता. उदाहरण के लिए,
झलक वाले वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता. ध्यान दें कि झलक वाले वर्शन, हमेशा उस मॉडल के नए झलक वर्शन पर ले जाते हैं. अगर झलक का नया वर्शन रिलीज़ किया जाता है, तो झलक का कोई भी मौजूदा वर्शन, अपने-आप उस नए वर्शन पर ले जाता है.
- झलक वाले वर्शन में, मॉडल के नाम के साथ
जोड़ा जाता है. साथ ही, मॉडल के रिलीज़ होने की शुरुआती तारीख (-preview
) भी जोड़ी जाती है. उदाहरण के लिए,-MMDD
(9 अप्रैल, 2024 को रिलीज़ किया गया).gemini-1.5-pro-preview-0409
- झलक वाले वर्शन में, मॉडल के नाम के साथ
Google Cloud दस्तावेज़ में, उपलब्ध मॉडल वर्शन और उनके लाइफ़साइकल (Gemini) के बारे में ज़्यादा जानें.
उपलब्ध मॉडल के नाम
मॉडल के नाम, साफ़ तौर पर बताई गई वैल्यू होती हैं. इन्हें जनरेटिव मॉडल को शुरू करने के दौरान, अपने कोड में शामिल किया जाता है. यह Gemini API को कॉल करने के लिए ज़रूरी चरण है.
सभी उपलब्ध मॉडल के नामों की सूची देखने के लिए, publishers.models.list
एंडपॉइंट का इस्तेमाल किया जा सकता है. ध्यान दें कि इस सूची में, Vertex AI के साथ काम करने वाले सभी मॉडल शामिल होंगे. हालांकि, Vertex AI in Firebase सिर्फ़ इस पेज पर बताए गए Gemini मॉडल के साथ काम करता है.
यह भी ध्यान दें कि अपने-आप अपडेट होने वाले वर्शन (उदाहरण के लिए, gemini-2.0-flash
) सूची में शामिल नहीं किए जाते, क्योंकि ये बुनियादी स्टेबल मॉडल के लिए आसानी से इस्तेमाल होने वाले दूसरे नाम होते हैं.
Gemini मॉडल के नाम
अपनी भाषा के लिए, शुरू करने के उदाहरणों के लिए, शुरू करने के लिए गाइड देखें.
Gemini 2.0 Flash मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का स्टेज | रिलीज़ होने की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-2.0-flash-001 |
Gemini 2.0 Flash का सबसे नया स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2025-02-05 | निर्धारण शेष |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-2.0-flash |
2.0 Flash (फ़िलहाल gemini-2.0-flash-001 |
सामान्य रूप से उपलब्ध | 2025-02-10 | --- |
Gemini 1.5 Pro मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का स्टेज | रिलीज़ होने की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.5-pro-002 |
Gemini 1.5 Pro का सबसे नया स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-09-24 | 24-09-2025 से पहले नहीं |
gemini-1.5-pro-001 |
Gemini 1.5 Pro का शुरुआती स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-05-24 | 24-05-2025 से पहले नहीं |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.5-pro |
1.5 Pro के सबसे नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-002 |
सामान्य रूप से उपलब्ध | 2024-09-24 | --- |
Gemini 1.5 Flash मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का स्टेज | रिलीज़ होने की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.5-flash-002 |
Gemini 1.5 Flash का सबसे नया स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-09-24 | 24-09-2025 से पहले नहीं |
gemini-1.5-flash-001 |
Gemini 1.5 Flash का शुरुआती स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-05-24 | 24-05-2025 से पहले नहीं |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.5-flash |
1.5 Flash के सबसे नए स्टेबल वर्शन पर ले जाता है. फ़िलहाल, यह वर्शन gemini-1.5-flash-002 |
सामान्य रूप से उपलब्ध | 2024-09-24 | --- |
इस्तेमाल की जा सकने वाली भाषाएं
Gemini
सभी Gemini मॉडल, इन भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:
ऐरेबिक (ar), बांग्ला (bn), बुल्गारियन (bg), चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), अंग्रेज़ी (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हिब्रू (iw), हिन्दी (hi), हंगेरियन (hu), इंडोनेशियन (id), इटैलियन (it), जैपनीज़ (ja), कोरियन (ko), लातवियन (lv), लिथुआनियन (lt), नॉर्वेजियन (no), पोलिश (pl), पॉर्चगीज़ (pt), रोमेनियन (ro), रशियन (ru), सर्बियन (sr), स्लोवाक (sk), स्लोवेनियन (sl), स्पैनिश (es), स्वाहिली (sw), स्वीडिश (sv), थाई (th), टर्किश (tr), यूक्रेनियन (uk), वियतनामीज़ (vi)
Gemini 1.5 Pro और Gemini 1.5 Flash मॉडल, इन अन्य भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:
अफ़्रीकान्स (af), अम्हारिक (am), असमिया (as), अज़रबैजानियन (az), बेलारूशियन (be), बोस्नियाई (bs), कैटलन (ca), सिबुआनो (ceb), कोर्सिकन (co), वेल्श (cy), दीवेही (dv), एस्पेरांटो (eo), बास्क (eu), फ़ारसी (fa), फ़िलिपिनो (Tagalog) (fil), फ़्रिसियन (fy), आयरिश (ga), स्कॉटिश गेलिक (gd), गैलिशियन (gl), गुजराती (gu), हौसा (ha), हवाईयन (haw), हमोंग (hmn), हैतीयन क्रेओल (ht), अर्मेनियाई (hy), इग्बो (ig), आइसलैंडिक (is), ज्वानेस (jv), जॉर्जियन (ka), कज़ाख (kk), खमेर (km), कन्नड़ (kn), क्रियो (kri), कुर्दीश (ku), किर्गिज़ (ky), लैटिन (la), लक्ज़मबर्गिश (lb), लाओ (lo), मलागासी (mg), माओरी (mi), मैसेडोनियन (mk), मलयालम (ml), मंगोलियन (mn), मेइतेइलोन (मणिपुरी) (mni-Mtei), मराठी (mr), मलय (ms), माल्टीज़ (mt), म्यांमार (बर्मीज़) (my), नेपाली (ne), न्यान्या (चिचेवा) (ny), ओडिया (ओडिया) (or), पंजाबी (pa), पश्तो (ps), सिंधी (sd), सिंघल (सिंघल) (si), समोआन (sm), शोना (sn), सोमाली (so), अल्बानियाई (sq), सेसोथो (st), सुंडानी (su), तमिल (ta), तेलुगु (te), ताजिक (tg), उइघुर (ug), उर्दू (ur), उज़्बेक (uz), ज़ोसा (xh), येहुदी (yi), योरुबा (yo), ज़ुलु (zu)
पुराने मॉडल के बारे में जानकारी
Vertex AI in Firebase, Gemini के सभी मॉडल के साथ काम करता है. इनमें Gemini 1.0 Pro और Gemini 1.0 Pro Vision जैसे पुराने मॉडल भी शामिल हैं. हालांकि, हमारा सुझाव है कि आप हमारे SDK टूल के साथ नए मॉडल का इस्तेमाल करें. इन पुराने Gemini मॉडल को बंद करने की तारीख आ रही है. साथ ही, इनमें नए मॉडल की सभी सुविधाएं उपलब्ध नहीं हैं.
अगले चरण
Gemini API की सुविधाएं आज़माएं
- कई बार की जाने वाली बातचीत (चैट) बनाएं.
- सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करें.
- मल्टीमोडल प्रॉम्प्ट (जैसे, टेक्स्ट, इमेज, PDF, वीडियो, और ऑडियो) से टेक्स्ट जनरेट करें.
- टेक्स्ट और मल्टीमोडल प्रॉम्प्ट, दोनों से स्ट्रक्चर्ड आउटपुट (जैसे कि JSON) जनरेट करें.
- जनरेटिव मॉडल को बाहरी सिस्टम और जानकारी से कनेक्ट करने के लिए, फ़ंक्शन कॉल का इस्तेमाल करें.