मॉडल के Gemini फ़ैमिली को मल्टीमॉडल माना जाता है, क्योंकि वे इसमें सक्षम हैं कई तरीकों से जानकारी प्रोसेस की जाती है. इनमें इमेज, वीडियो, और और टेक्स्ट. उदाहरण के लिए, Gemini मॉडल को प्लेट की प्लेट की फ़ोटो भेजी जा सकती है कुकी ढूंढी है और इससे उन कुकी की रेसिपी आपको देने के लिए कह सकती है.
प्रॉम्प्ट | जवाब |
मुझे इन कुकीज़ की रेसिपी बताओ. |
**सामग्री** - 1 सी. (2 स्टिक) बिना नमक वाला, नर्म किया हुआ मक्खन - 3/4 सी. दानेदार शुगर - 3/4 सी. ब्राउन शुगर, पैक की गई - 1 छोटा चम्मच . वनिला एक्स्ट्रैक्ट - 2 बड़े अंडे - 2 1/4 सी. सभी तरह का आटा - 1 छोटा चम्मच. बेकिंग सोडा - 1 छोटा चम्मच. नमक ... |
मॉडल के Gemini फ़ैमिली के साथ इंटरैक्ट किया जा सकता है. इसके लिए, इनका इस्तेमाल करें: Vertex AI की ओर से उपलब्ध कराया गया Gemini API Google Cloud पर. मोबाइल और वेब ऐप्लिकेशन के लिए, Firebase SDK टूल के लिए Vertex AI की मदद से, Gemini API को कॉल किया जा सकता है. साथ ही, Gemini के मॉडल सीधे आपके ऐप्लिकेशन से डाउनलोड किए जा सकते हैं.
इस पेज पर, Gemini के मॉडल के बारे में यह जानकारी दी गई है:
Gemini के इस्तेमाल के उदाहरणों की बेहतर तरीके से तुलना साथ ही, इसमें मॉडल के साथ काम करने वाले इनपुट टाइप भी शामिल करें.
हर मॉडल के ब्यौरे की तुलना, उदाहरण के लिए अधिकतम इनपुट टोकन या वीडियो की अधिकतम अवधि.
Gemini के मॉडल के वर्शन होने की जानकारी. ख़ास तौर पर, इस बारे में जानकारी उनके स्टेबल, अपने-आप अपडेट होने वाले, और झलक वर्शन शामिल होने चाहिए.
अपने कॉलम में शामिल करने के लिए, उपलब्ध मॉडल नामों की सूचियां कोड को लागू करना शुरू करें.
Gemini मॉडल के लिए, इस्तेमाल की जा सकने वाली भाषाओं की सूची.
उपलब्ध मॉडल
Firebase के लिए Vertex AI के साथ, Gemini के इनमें से किसी भी मॉडल का इस्तेमाल किया जा सकता है:
Gemini 1.5 Flash
एक जैसे इनपुट और आउटपुट के साथ काम करने वाला मल्टीमोडल मॉडल टाइप 1.5 Pro (और साथ ही कुल टोकन काउंट) हैं, लेकिन 1.5 Flash खास तौर पर इसे ज़्यादा वॉल्यूम और किफ़ायती ऐप्लिकेशन के लिए डिज़ाइन किया गया है.Gemini 1.5 Pro
मल्टीमोडल मॉडल की मदद से इमेज, ऑडियो, वीडियो, और टेक्स्ट या चैट प्रॉम्प्ट में PDF फ़ाइलें शामिल हों. साथ ही, यह 10 लाख टोकन तक के लंबे कॉन्टेक्स्ट को समझने में मदद करता है.Gemini 1.0 Pro विज़न
टेक्स्ट और टेक्स्ट को हैंडल करने के लिए डिज़ाइन किया गया मल्टीमोडल मॉडल टेक्स्ट या कोड से मिलने वाले जवाब के लिए इमेज और वीडियो. चैट के लिए इस्तेमाल नहीं किया जा सकता.Gemini 1.0 Pro
नैचुरल लैंग्वेज से जुड़े टास्क पूरे करने के लिए डिज़ाइन किया गया मॉडल. टेक्स्ट और कोड के साथ चैट करें. साथ ही, कोड जनरेट करें.
अपने कोड में शामिल करने के लिए, सीधे मॉडल का नाम पर जाएं
हर मॉडल के लिए इस्तेमाल के उदाहरण और सुविधाएं
Gemini के हर मॉडल में, अलग-अलग कामों के लिए अलग-अलग सुविधाएँ उपलब्ध हैं. Google Cloud दस्तावेज़ में, इन कामों के बारे में ज़्यादा जानकारी पाई जा सकती है Gemini के मॉडल.
हर मॉडल के लिए काम करने वाले इनपुट और आउटपुट
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro विज़न | Gemini 1.0 Pro | |
---|---|---|---|---|
इनपुट के टाइप | ||||
टेक्स्ट | ||||
कोड | ||||
इमेज | ||||
वीडियो (सिर्फ़ फ़्रेम) | ||||
वीडियो (फ़्रेम और ऑडियो) | ||||
ऑडियो | ||||
आउटपुट टाइप | ||||
टेक्स्ट | ||||
कोड |
इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, यहां जाएं Vertex AI Gemini API के साथ काम करने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें.
हर मॉडल के लिए इस्तेमाल की जा सकने वाली सुविधाएं और सामान्य सुविधाएं
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro विज़न | Gemini 1.0 Pro | ||
---|---|---|---|---|---|
सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करना | |||||
मल्टीमॉडल प्रॉम्प्ट से टेक्स्ट जनरेट करना | |||||
JSON आउटपुट (सीमित स्कीमा मोड) (यह सुविधा जल्द ही 'Firebase के लिए Vertex AI' SDK टूल के लिए उपलब्ध होगी) |
|||||
बारी-बारी से चैट करने की सुविधा | |||||
फ़ंक्शन कॉलिंग | |||||
बेसिक फ़ंक्शन कॉलिंग | |||||
पैरलल फ़ंक्शन कॉलिंग | |||||
फ़ंक्शन कॉलिंग मोड | |||||
गिनती टोकन और बिल करने लायक वर्ण | |||||
सिस्टम के लिए निर्देश |
हर मॉडल के बारे में विस्तृत जानकारी
प्रॉपर्टी |
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro विज़न | Gemini 1.0 Pro |
---|---|---|---|
टोकन की कुल सीमा (सभी इनपुट और आउटपुट मिले-जुले) * | 10 लाख टोकन | 16,384 टोकन | 32,760 टोकन |
आउटपुट टोकन की सीमा * | 8,192 टोकन | 2,048 टोकन | 8,192 टोकन |
हर अनुरोध के लिए, ज़्यादा से ज़्यादा इमेज इस्तेमाल करने की अनुमति दें | 3,000 इमेज | 16 इमेज | लागू नहीं |
base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ | 7 एमबी | 7 एमबी | लागू नहीं |
PDF का ज़्यादा से ज़्यादा साइज़ | 30 एमबी | 30 एमबी | लागू नहीं |
हर अनुरोध के लिए वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या | 10 वीडियो फ़ाइलें | 1 वीडियो फ़ाइल | लागू नहीं |
वीडियो की ज़्यादा से ज़्यादा अवधि (सिर्फ़ फ़्रेम के लिए) | 60 मिनट का वीडियो | 2 मिनट | लागू नहीं |
वीडियो की ज़्यादा से ज़्यादा अवधि (फ़्रेम और ऑडियो) | ~45 मिनट का वीडियो | लागू नहीं | लागू नहीं |
हर अनुरोध में ज़्यादा से ज़्यादा ऑडियो फ़ाइलों की संख्या | 1 ऑडियो फ़ाइल | लागू नहीं | लागू नहीं |
ऑडियो कितना लंबा हो सकता है | ~8.4 घंटे का ऑडियो | लागू नहीं | लागू नहीं |
* Gemini के सभी मॉडल के लिए, एक टोकन में करीब चार वर्ण होते हैं,
इसलिए 100 टोकन, करीब 60 से 80 शब्दों के अंग्रेज़ी के होते हैं. आपके पास कुल संख्या तय करने का विकल्प होता है
का उपयोग करके आपके अनुरोधों में टोकन की
countTokens
.
यहां बताया गया है कि मॉडल कैसे काम करते हैं और इनपुट फ़ाइलें:
ज़्यादा जानने के लिए, मल्टीमॉडल मॉडल के बीच अंतर.
इस्तेमाल किए जा सकने वाले फ़ाइल टाइप, MIME टाइप तय करने के तरीके, और उन्हें बनाने के तरीके के बारे में जानें पक्का करें कि आपकी फ़ाइलें और मल्टीमोडल अनुरोध ज़रूरी शर्तों को पूरा करते हों. साथ ही, सबसे सही तरीके Vertex AI Gemini API के साथ काम करने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें.
मॉडल की वर्शनिंग
Gemini के मॉडल को स्टेबल, अपने-आप अपडेट होने वाले, और झलक में दिखाया जाता है versions.
स्टेबल वर्शन को सामान्य रूप से उपलब्ध माना जाता है.
- स्थिर वर्शन में मॉडल का नाम होता है
तीन अंकों वाला वर्शन नंबर डालें, उदाहरण के लिए
.gemini-1.0-pro-001
- स्थिर वर्शन में मॉडल का नाम होता है
तीन अंकों वाला वर्शन नंबर डालें, उदाहरण के लिए
अपने-आप अपडेट होने वाले वर्शन हमेशा, इसके सबसे नए स्टेबल वर्शन पर ले जाते हैं वह मॉडल; अगर कोई नया स्टेबल वर्शन रिलीज़ किया गया है, तो अपने-आप अपडेट होने वाला वर्शन अपने-आप उस नए स्थिर वर्शन की ओर पॉइंट करना शुरू कर देता है.
- अपने-आप अपडेट होने वाले वर्शन में मॉडल का नाम होता है
जोड़ें, उदाहरण के लिए
.gemini-1.0-pro
- अपने-आप अपडेट होने वाले वर्शन में मॉडल का नाम होता है
जोड़ें, उदाहरण के लिए
झलक देखें वर्शन में नई सुविधाएं जोड़ी गई हैं. इसलिए, इन्हें स्टेबल नहीं माना जाता है. ध्यान दें कि झलक वर्शन हमेशा इसके सबसे नए झलक वर्शन पर ले जाते हैं वह मॉडल; अगर झलक का कोई नया वर्शन रिलीज़ किया जाता है, तो झलक दिखाने वाला कोई भी मौजूदा वर्शन अपने-आप उस नए झलक वर्शन पर ले जाना शुरू कर देता है.
- झलक वाले वर्शन में मॉडल के नाम जोड़े जाते हैं
और मॉडल की शुरुआती रिलीज़ तारीख (-preview
), उदाहरण के लिए-MMDD
(9 अप्रैल, 2024 को रिलीज़ किया गया).gemini-1.5-pro-preview-0409
- झलक वाले वर्शन में मॉडल के नाम जोड़े जाते हैं
ज़्यादा जानने के लिए, Gemini के उपलब्ध वर्शन और उनका लाइफ़साइकल सेक्शन पढ़ें.
उपलब्ध मॉडल के नाम
मॉडल के नाम वे स्पष्ट वैल्यू होते हैं जिन्हें आप अपने कोड में जनरेटिव मॉडल शुरू करना (जो कि Gemini API). अपनी भाषा के शुरुआती उदाहरण देखने के लिए, शुरुआती निर्देश.
Gemini 1.5 Flash मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.5-flash-001 |
Gemini 1.5 फ़्लैश का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-05-24 | 24-05-2025 से पहले की नहीं |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.5-flash |
उपयोगकर्ता, 1.5 फ़्लैश के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-flash-001 |
सामान्य रूप से उपलब्ध | 2024-05-24 | --- |
वर्शन की झलक देखना | ||||
gemini-1.5-flash-preview-0514 |
Gemini 1.5 फ़्लैश के नए वर्शन की झलक | सभी के लिए उपलब्ध झलक | 2024-05-14 | 2024-06-24 |
Gemini 1.5 Pro मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.5-pro-001 |
Gemini 1.5 Pro का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-05-24 | 24-05-2025 से पहले की नहीं |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.5-pro |
उपयोगकर्ताओं को 1.5 Pro के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-001 |
सामान्य रूप से उपलब्ध | 2024-05-24 | --- |
वर्शन की झलक देखना | ||||
gemini-1.5-pro-preview-0514 |
Gemini 1.5 Pro के नए वर्शन की झलक | सभी के लिए उपलब्ध झलक | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
gemini-1.5-pro-preview-0514 (यह झलक का सबसे नया वर्शन है) |
सभी के लिए उपलब्ध झलक | 2024-04-09 | 2024-06-14 |
Gemini 1.0 Pro Vision मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.0-pro-vision-001 |
Gemini 1.0 Pro Vision का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-02-15 | 15-02-2025 से पहले की नहीं है |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.0-pro-vision |
उपयोगकर्ताओं को 1.5 Pro Vision के नए और स्थिर वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-vision-001 |
सामान्य रूप से उपलब्ध | 2024-01-04 | --- |
Gemini 1.0 Pro मॉडल के नाम
मॉडल का नाम | जानकारी | रिलीज़ का चरण | शुरुआती रिलीज़ की तारीख | बंद होने की तारीख |
---|---|---|---|---|
स्टेबल वर्शन | ||||
gemini-1.0-pro-002 |
Gemini 1.0 Pro का नया और स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-04-09 | 09-04-2025 से पहले की नहीं है |
gemini-1.0-pro-001 |
Gemini 1.0 Pro का स्टेबल वर्शन | सामान्य रूप से उपलब्ध | 2024-02-15 | 15-02-2025 से पहले की नहीं है |
अपने-आप अपडेट होने वाला वर्शन | ||||
gemini-1.0-pro |
उपयोगकर्ताओं को 1.0 Pro के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.0-pro-002 |
सामान्य रूप से उपलब्ध | 2024-02-15 | --- |
यह सुविधा इन भाषाओं में काम करती है
Gemini के मॉडल को इन भाषाओं में इस्तेमाल किया जा सकता है:
Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi).
अगले चरण
Gemini API की सुविधाओं को आज़माएं
- एक के बाद एक बातचीत (चैट) बनाएं.
- यहां से टेक्स्ट जनरेट करें सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट.
- यहां से टेक्स्ट जनरेट करें मल्टीमॉडल प्रॉम्प्ट (इसमें टेक्स्ट, इमेज, PDF, वीडियो, और ऑडियो शामिल हैं).
- कनेक्ट करने के लिए, फ़ंक्शन कॉलिंग का इस्तेमाल करें जनरेटिव मॉडल से लेकर बाहरी सिस्टम और जानकारी.