इस्तेमाल किए जा सकने वाले मॉडल के बारे में जानें

मोबाइल और वेब ऐप्लिकेशन के लिए, Vertex AI in Firebase SDK टूल की मदद से, अपने ऐप्लिकेशन से सीधे तौर पर, काम करने वाले Gemini मॉडल के साथ इंटरैक्ट किया जा सकता है.

Gemini मॉडल को मल्टीमोडल माना जाता है, क्योंकि ये टेक्स्ट, कोड, PDF, इमेज, वीडियो, और ऑडियो जैसे कई मोड को प्रोसेस करने और जनरेट करने में सक्षम होते हैं.

यहां Vertex AI in Firebase के साथ काम करने वाले मॉडल और उनके सबसे नए वर्शन के बारे में खास जानकारी दी गई है. इस पेज पर आगे दिए गए सेक्शन में, तुलना और जानकारी के बारे में ज़्यादा जानकारी दी गई है.

मॉडल इनपुट आउटपुट इनके लिए ऑप्टिमाइज़ किया गया
Gemini मॉडल
Gemini 2.0 Flash
gemini-2.0-flash-001
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON
(इमेज और ऑडियो की सुविधा जल्द ही उपलब्ध होगी!)
अलग-अलग तरह के कामों के लिए, अगली पीढ़ी की सुविधाएं, तेज़ी, और कई मोड में जनरेट करने की सुविधा
Gemini 1.5 Pro
gemini-1.5-pro-002
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON ऐसे जटिल काम जिनमें ज़्यादा बुद्धिमत्ता की ज़रूरत होती है
Gemini 1.5 Flash
gemini-1.5-flash-002
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो टेक्स्ट, कोड, JSON अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस


इस पेज के बाकी हिस्से में, Vertex AI in Firebase के साथ काम करने वाले मॉडल के बारे में पूरी जानकारी दी गई है:

इस पेज पर सबसे नीचे, पुराने मॉडल के बारे में ज़्यादा जानकारी देखी जा सकती है.



मॉडल की तुलना करना

हर मॉडल में अलग-अलग सुविधाएं होती हैं, ताकि अलग-अलग तरह के कामों में इस्तेमाल किया जा सके. ध्यान दें कि Vertex AI in Firebase के साथ इस्तेमाल करने पर, इस सेक्शन की हर टेबल में हर मॉडल के बारे में जानकारी दी जाती है. हर मॉडल में ऐसी अतिरिक्त सुविधाएं हो सकती हैं जो हमारे SDK टूल का इस्तेमाल करते समय उपलब्ध नहीं होतीं.

Google Cloud दस्तावेज़ में, Gemini मॉडल के बारे में ज़्यादा जानें.

इस्तेमाल किए जा सकने वाले इनपुट और आउटपुट

Vertex AI in Firebase के साथ हर मॉडल का इस्तेमाल करते समय, इनपुट और आउटपुट के ये टाइप इस्तेमाल किए जा सकते हैं:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
इनपुट टाइप
टेक्स्ट
कोड
दस्तावेज़ (PDF या सादा टेक्स्ट)
इमेज, वीडियो, और ऑडियो
ऑडियो (स्ट्रीमिंग) जल्द ही उपलब्ध होगा!
आउटपुट टाइप
टेक्स्ट
स्ट्रक्चर्ड आउटपुट (जैसे, JSON)
कोड
इमेज जल्द ही उपलब्ध होगा!
ऑडियो जल्द ही उपलब्ध होगा!
ऑडियो (स्ट्रीमिंग) जल्द ही उपलब्ध होगा!

इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, Vertex AI Gemini API के लिए इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें देखें.

इस्तेमाल की जा सकने वाली सुविधाएं और क्षमताएं

Vertex AI in Firebase के साथ हर मॉडल का इस्तेमाल करते समय, ये सुविधाएं और काम करने की क्षमताएं उपलब्ध होती हैं:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
टेक्स्ट या मल्टीमोडल इनपुट से टेक्स्ट जनरेट करना
इमेज जनरेट करें जल्द ही उपलब्ध होगा!
ऑडियो जनरेट करना जल्द ही उपलब्ध होगा!
JSON जैसे स्ट्रक्चर्ड आउटपुट जनरेट करना
इमेज और वीडियो का विश्लेषण करना (विज़न)
ऑडियो का विश्लेषण करना
दस्तावेज़ों (PDF या सादा टेक्स्ट) का विश्लेषण करना
मल्टी-टर्न चैट
फ़ंक्शन कॉल करना (टूल)
फ़ंक्शन को बुलाना
एक साथ कई फ़ंक्शन कॉल करना
फ़ंक्शन कॉलिंग मोड
टोकन और बिलिंग के लिए ज़रूरी वर्णों की गिनती करना
सिस्टम से जुड़े निर्देश
मल्टीमोडल लाइव एपीआई (दोतरफ़ा स्ट्रीमिंग) जल्द ही उपलब्ध होगा!

खास जानकारी और सीमाएं

Vertex AI in Firebase के साथ हर मॉडल का इस्तेमाल करते समय, ये खास बातें और सीमाएं लागू होती हैं:

प्रॉपर्टी Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
कॉन्टेक्स्ट विंडो *
टोकन की कुल सीमा (इनपुट+आउटपुट को मिलाकर)
1,048,576 टोकन 2,097,152 टोकन 1,048,576 टोकन
आउटपुट टोकन की सीमा * 8,192 टोकन 8,192 टोकन 8,192 टोकन
नॉलेज कट्सऑफ़ की तारीख जून 2024 मई 2024 मई 2024
इमेज (हर अनुरोध के लिए)
इनपुट इमेज की ज़्यादा से ज़्यादा संख्या 3,000 इमेज 3,000 इमेज 3,000 इमेज
आउटपुट इमेज की ज़्यादा से ज़्यादा संख्या जल्द ही उपलब्ध होगा! --- ---
Base64 कोड में बदली गई हर इनपुट इमेज का ज़्यादा से ज़्यादा साइज़ 7 एमबी 7 एमबी 7 एमबी
PDF (हर अनुरोध के हिसाब से)
इनपुट PDF फ़ाइलों की ज़्यादा से ज़्यादा संख्या ** 3,000 फ़ाइलें 3,000 फ़ाइलें 3,000 फ़ाइलें
हर इनपुट PDF फ़ाइल में पेजों की ज़्यादा से ज़्यादा संख्या ** 1,000 पेज 1,000 पेज 1,000 पेज
हर इनपुट PDF फ़ाइल का ज़्यादा से ज़्यादा साइज़ 50 एमबी 50 एमबी 50 एमबी
वीडियो (हर अनुरोध के हिसाब से)
इनपुट वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या 10 फ़ाइलें 10 फ़ाइलें 10 फ़ाइलें
सभी इनपुट वीडियो की ज़्यादा से ज़्यादा लंबाई (सिर्फ़ फ़्रेम) ~60 मिनट ~60 मिनट ~60 मिनट
सभी इनपुट वीडियो (फ़्रेम+ऑडियो) की ज़्यादा से ज़्यादा अवधि ~45 मिनट ~45 मिनट ~45 मिनट
ऑडियो (हर अनुरोध के हिसाब से)
इनपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या 1 फ़ाइल 1 फ़ाइल 1 फ़ाइल
आउटपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या जल्द ही उपलब्ध होगा! --- ---
सभी इनपुट ऑडियो की ज़्यादा से ज़्यादा अवधि ~8.4 घंटे ~8.4 घंटे ~8.4 घंटे
सभी आउटपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई जल्द ही उपलब्ध होगा! --- ---

* सभी मॉडल के लिए, एक टोकन करीब चार वर्णों के बराबर होता है. इसलिए, 100 टोकन करीब 60 से 80 अंग्रेज़ी शब्दों के बराबर होते हैं. Gemini मॉडल के लिए, countTokens का इस्तेमाल करके, अपने अनुरोधों में टोकन की कुल संख्या तय की जा सकती है.

** PDF को इमेज के तौर पर माना जाता है. इसलिए, PDF के एक पेज को एक इमेज के तौर पर माना जाता है. अनुरोध में पेजों की संख्या, उन इमेज की संख्या तक सीमित होती है जिनके लिए मॉडल काम करता है.

ज़्यादा जानकारी पाना



मॉडल के वर्शन और नाम देने के पैटर्न

मॉडल, स्टैबल, अपने-आप अपडेट होने वाले, और झलक वर्शन में उपलब्ध होते हैं.

  • स्टैबल वर्शन को आम तौर पर उपलब्ध माना जाता है.

    • स्टेबल वर्शन में, मॉडल के नाम के साथ तीन अंकों का वर्शन नंबर जोड़ा जाता है. उदाहरण के लिए, gemini-2.0-flash-001.
  • अपने-आप अपडेट होने वाले वर्शन, हमेशा उस मॉडल के नए स्टैबल वर्शन पर ले जाते हैं. अगर कोई नया स्टैबल वर्शन रिलीज़ किया जाता है, तो अपने-आप अपडेट होने वाला वर्शन, अपने-आप उस नए स्टैबल वर्शन पर ले जाता है.

    • अपने-आप अपडेट होने वाले वर्शन में, मॉडल के नाम के साथ कोई ऐपेंडेज नहीं होता. उदाहरण के लिए, gemini-2.0-flash.
  • झलक वाले वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता. ध्यान दें कि झलक वाले वर्शन, हमेशा उस मॉडल के नए झलक वर्शन पर ले जाते हैं. अगर झलक का नया वर्शन रिलीज़ किया जाता है, तो झलक का कोई भी मौजूदा वर्शन, अपने-आप उस नए वर्शन पर ले जाता है.

    • झलक वाले वर्शन में, मॉडल के नाम के साथ -preview जोड़ा जाता है. साथ ही, मॉडल के रिलीज़ होने की शुरुआती तारीख (-MMDD) भी जोड़ी जाती है. उदाहरण के लिए, gemini-1.5-pro-preview-0409 (9 अप्रैल, 2024 को रिलीज़ किया गया).

Google Cloud दस्तावेज़ में, उपलब्ध मॉडल वर्शन और उनके लाइफ़साइकल (Gemini) के बारे में ज़्यादा जानें.



उपलब्ध मॉडल के नाम

मॉडल के नाम, साफ़ तौर पर बताई गई वैल्यू होती हैं. इन्हें जनरेटिव मॉडल को शुरू करने के दौरान, अपने कोड में शामिल किया जाता है. यह Gemini API को कॉल करने के लिए ज़रूरी चरण है.

सभी उपलब्ध मॉडल के नामों की सूची देखने के लिए, publishers.models.list एंडपॉइंट का इस्तेमाल किया जा सकता है. ध्यान दें कि इस सूची में, Vertex AI के साथ काम करने वाले सभी मॉडल शामिल होंगे. हालांकि, Vertex AI in Firebase सिर्फ़ इस पेज पर बताए गए Gemini मॉडल के साथ काम करता है. यह भी ध्यान दें कि अपने-आप अपडेट होने वाले वर्शन (उदाहरण के लिए, gemini-2.0-flash) सूची में शामिल नहीं किए जाते, क्योंकि ये बुनियादी स्टेबल मॉडल के लिए आसानी से इस्तेमाल होने वाले दूसरे नाम होते हैं.

Gemini मॉडल के नाम

अपनी भाषा के लिए, शुरू करने के उदाहरणों के लिए, शुरू करने के लिए गाइड देखें.

Gemini 2.0 Flash मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का स्टेज रिलीज़ होने की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-2.0-flash-001 Gemini 2.0 Flash का सबसे नया स्टेबल वर्शन सामान्य रूप से उपलब्ध 2025-02-05 निर्धारण शेष
अपने-आप अपडेट होने वाला वर्शन
gemini-2.0-flash 2.0 Flash
(फ़िलहाल gemini-2.0-flash-001) के सबसे नए स्टेबल वर्शन पर ले जाता है
सामान्य रूप से उपलब्ध 2025-02-10 ---

Gemini 1.5 Pro मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का स्टेज रिलीज़ होने की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.5-pro-002 Gemini 1.5 Pro का सबसे नया स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-09-24 24-09-2025 से पहले नहीं
gemini-1.5-pro-001 Gemini 1.5 Pro का शुरुआती स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-05-24 24-05-2025 से पहले नहीं
अपने-आप अपडेट होने वाला वर्शन
gemini-1.5-pro 1.5 Pro
के सबसे नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-002)
सामान्य रूप से उपलब्ध 2024-09-24 ---

Gemini 1.5 Flash मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का स्टेज रिलीज़ होने की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.5-flash-002 Gemini 1.5 Flash का सबसे नया स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-09-24 24-09-2025 से पहले नहीं
gemini-1.5-flash-001 Gemini 1.5 Flash का शुरुआती स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-05-24 24-05-2025 से पहले नहीं
अपने-आप अपडेट होने वाला वर्शन
gemini-1.5-flash 1.5 Flash
के सबसे नए स्टेबल वर्शन पर ले जाता है. फ़िलहाल, यह वर्शन gemini-1.5-flash-002 है
सामान्य रूप से उपलब्ध 2024-09-24 ---



इस्तेमाल की जा सकने वाली भाषाएं

Gemini

  • सभी Gemini मॉडल, इन भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:

    ऐरेबिक (ar), बांग्ला (bn), बुल्गारियन (bg), चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), अंग्रेज़ी (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हिब्रू (iw), हिन्दी (hi), हंगेरियन (hu), इंडोनेशियन (id), इटैलियन (it), जैपनीज़ (ja), कोरियन (ko), लातवियन (lv), लिथुआनियन (lt), नॉर्वेजियन (no), पोलिश (pl), पॉर्चगीज़ (pt), रोमेनियन (ro), रशियन (ru), सर्बियन (sr), स्लोवाक (sk), स्लोवेनियन (sl), स्पैनिश (es), स्वाहिली (sw), स्वीडिश (sv), थाई (th), टर्किश (tr), यूक्रेनियन (uk), वियतनामीज़ (vi)

  • Gemini 1.5 Pro और Gemini 1.5 Flash मॉडल, इन अन्य भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:

    अफ़्रीकान्स (af), अम्हारिक (am), असमिया (as), अज़रबैजानियन (az), बेलारूशियन (be), बोस्नियाई (bs), कैटलन (ca), सिबुआनो (ceb), कोर्सिकन (co), वेल्श (cy), दीवेही (dv), एस्पेरांटो (eo), बास्क (eu), फ़ारसी (fa), फ़िलिपिनो (Tagalog) (fil), फ़्रिसियन (fy), आयरिश (ga), स्कॉटिश गेलिक (gd), गैलिशियन (gl), गुजराती (gu), हौसा (ha), हवाईयन (haw), हमोंग (hmn), हैतीयन क्रेओल (ht), अर्मेनियाई (hy), इग्बो (ig), आइसलैंडिक (is), ज्वानेस (jv), जॉर्जियन (ka), कज़ाख (kk), खमेर (km), कन्नड़ (kn), क्रियो (kri), कुर्दीश (ku), किर्गिज़ (ky), लैटिन (la), लक्ज़मबर्गिश (lb), लाओ (lo), मलागासी (mg), माओरी (mi), मैसेडोनियन (mk), मलयालम (ml), मंगोलियन (mn), मेइतेइलोन (मणिपुरी) (mni-Mtei), मराठी (mr), मलय (ms), माल्टीज़ (mt), म्यांमार (बर्मीज़) (my), नेपाली (ne), न्यान्या (चिचेवा) (ny), ओडिया (ओडिया) (or), पंजाबी (pa), पश्तो (ps), सिंधी (sd), सिंघल (सिंघल) (si), समोआन (sm), शोना (sn), सोमाली (so), अल्बानियाई (sq), सेसोथो (st), सुंडानी (su), तमिल (ta), तेलुगु (te), ताजिक (tg), उइघुर (ug), उर्दू (ur), उज़्बेक (uz), ज़ोसा (xh), येहुदी (yi), योरुबा (yo), ज़ुलु (zu)



पुराने मॉडल के बारे में जानकारी

Vertex AI in Firebase, Gemini के सभी मॉडल के साथ काम करता है. इनमें Gemini 1.0 Pro और Gemini 1.0 Pro Vision जैसे पुराने मॉडल भी शामिल हैं. हालांकि, हमारा सुझाव है कि आप हमारे SDK टूल के साथ नए मॉडल का इस्तेमाल करें. इन पुराने Gemini मॉडल को बंद करने की तारीख आ रही है. साथ ही, इनमें नए मॉडल की सभी सुविधाएं उपलब्ध नहीं हैं.



अगले चरण

Gemini API की सुविधाएं आज़माएं