Gemini के मॉडल के बारे में जानकारी

मॉडल के Gemini फ़ैमिली को मल्टीमॉडल माना जाता है, क्योंकि वे इसमें सक्षम हैं कई तरीकों से जानकारी प्रोसेस की जाती है. इनमें इमेज, वीडियो, और और टेक्स्ट. उदाहरण के लिए, Gemini मॉडल को प्लेट की प्लेट की फ़ोटो भेजी जा सकती है कुकी ढूंढी है और इससे उन कुकी की रेसिपी आपको देने के लिए कह सकती है.

प्रॉम्प्ट जवाब

मुझे इन कुकीज़ की रेसिपी बताओ.

कई चॉकलेट चिप कुकी की तस्वीर
**सामग्री**
- 1 सी. (2 स्टिक) बिना नमक वाला, नर्म किया हुआ मक्खन
- 3/4 सी. दानेदार शुगर
- 3/4 सी. ब्राउन शुगर, पैक की गई
- 1 छोटा चम्मच . वनिला एक्स्ट्रैक्ट
- 2 बड़े अंडे
- 2 1/4 सी. सभी तरह का आटा
- 1 छोटा चम्मच. बेकिंग सोडा
- 1 छोटा चम्मच. नमक
...

मॉडल के Gemini फ़ैमिली के साथ इंटरैक्ट किया जा सकता है. इसके लिए, इनका इस्तेमाल करें: Vertex AI की ओर से उपलब्ध कराया गया Gemini API Google Cloud पर. मोबाइल और वेब ऐप्लिकेशन के लिए, Firebase SDK टूल के लिए Vertex AI की मदद से, Gemini API को कॉल किया जा सकता है. साथ ही, Gemini के मॉडल सीधे आपके ऐप्लिकेशन से डाउनलोड किए जा सकते हैं.

इस पेज पर, Gemini के मॉडल के बारे में यह जानकारी दी गई है:

  • Gemini के इस्तेमाल के उदाहरणों की बेहतर तरीके से तुलना साथ ही, इसमें मॉडल के साथ काम करने वाले इनपुट टाइप भी शामिल करें.

  • हर मॉडल के ब्यौरे की तुलना, उदाहरण के लिए अधिकतम इनपुट टोकन या वीडियो की अधिकतम अवधि.

  • Gemini के मॉडल के वर्शन होने की जानकारी. ख़ास तौर पर, इस बारे में जानकारी उनके स्टेबल, अपने-आप अपडेट होने वाले, और झलक वर्शन शामिल होने चाहिए.

  • अपने कॉलम में शामिल करने के लिए, उपलब्ध मॉडल नामों की सूचियां कोड को लागू करना शुरू करें.

  • Gemini मॉडल के लिए, इस्तेमाल की जा सकने वाली भाषाओं की सूची.

उपलब्ध मॉडल

Firebase के लिए Vertex AI के साथ, Gemini के इनमें से किसी भी मॉडल का इस्तेमाल किया जा सकता है:

  • Gemini 1.5 Flash
    एक जैसे इनपुट और आउटपुट के साथ काम करने वाला मल्टीमोडल मॉडल टाइप 1.5 Pro (और साथ ही कुल टोकन काउंट) हैं, लेकिन 1.5 Flash खास तौर पर इसे ज़्यादा वॉल्यूम और किफ़ायती ऐप्लिकेशन के लिए डिज़ाइन किया गया है.

  • Gemini 1.5 Pro
    मल्टीमोडल मॉडल की मदद से इमेज, ऑडियो, वीडियो, और टेक्स्ट या चैट प्रॉम्प्ट में PDF फ़ाइलें शामिल हों. साथ ही, यह 10 लाख टोकन तक के लंबे कॉन्टेक्स्ट को समझने में मदद करता है.

  • Gemini 1.0 Pro विज़न
    टेक्स्ट और टेक्स्ट को हैंडल करने के लिए डिज़ाइन किया गया मल्टीमोडल मॉडल टेक्स्ट या कोड से मिलने वाले जवाब के लिए इमेज और वीडियो. चैट के लिए इस्तेमाल नहीं किया जा सकता.

  • Gemini 1.0 Pro
    नैचुरल लैंग्वेज से जुड़े टास्क पूरे करने के लिए डिज़ाइन किया गया मॉडल. टेक्स्ट और कोड के साथ चैट करें. साथ ही, कोड जनरेट करें.

अपने कोड में शामिल करने के लिए, सीधे मॉडल का नाम पर जाएं

हर मॉडल के लिए इस्तेमाल के उदाहरण और सुविधाएं

Gemini के हर मॉडल में, अलग-अलग कामों के लिए अलग-अलग सुविधाएँ उपलब्ध हैं. Google Cloud दस्तावेज़ में, इन कामों के बारे में ज़्यादा जानकारी पाई जा सकती है Gemini के मॉडल.

हर मॉडल के लिए काम करने वाले इनपुट और आउटपुट

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro विज़न Gemini 1.0 Pro
इनपुट के टाइप
टेक्स्ट
कोड
इमेज
PDF
वीडियो (सिर्फ़ फ़्रेम)
वीडियो (फ़्रेम और ऑडियो)
ऑडियो
आउटपुट टाइप
टेक्स्ट
कोड

इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, यहां जाएं Vertex AI Gemini API के साथ काम करने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें.

हर मॉडल के लिए इस्तेमाल की जा सकने वाली सुविधाएं और सामान्य सुविधाएं

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro विज़न Gemini 1.0 Pro
सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करना
मल्टीमॉडल प्रॉम्प्ट से टेक्स्ट जनरेट करना
JSON आउटपुट (सीमित स्कीमा मोड)
(यह सुविधा जल्द ही 'Firebase के लिए Vertex AI' SDK टूल के लिए उपलब्ध होगी)
बारी-बारी से चैट करने की सुविधा
फ़ंक्शन कॉलिंग
बेसिक फ़ंक्शन कॉलिंग
पैरलल फ़ंक्शन कॉलिंग
फ़ंक्शन कॉलिंग मोड
गिनती टोकन और बिल करने लायक वर्ण
सिस्टम के लिए निर्देश

हर मॉडल के बारे में विस्तृत जानकारी

प्रॉपर्टी Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro विज़न Gemini 1.0 Pro
टोकन की कुल सीमा (सभी इनपुट और आउटपुट मिले-जुले) * 10 लाख टोकन 16,384 टोकन 32,760 टोकन
आउटपुट टोकन की सीमा * 8,192 टोकन 2,048 टोकन 8,192 टोकन
हर अनुरोध के लिए, ज़्यादा से ज़्यादा इमेज इस्तेमाल करने की अनुमति दें 3,000 इमेज 16 इमेज लागू नहीं
base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ 7 एमबी 7 एमबी लागू नहीं
PDF का ज़्यादा से ज़्यादा साइज़ 30 एमबी 30 एमबी लागू नहीं
हर अनुरोध के लिए वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या 10 वीडियो फ़ाइलें 1 वीडियो फ़ाइल लागू नहीं
वीडियो की ज़्यादा से ज़्यादा अवधि (सिर्फ़ फ़्रेम के लिए) 60 मिनट का वीडियो 2 मिनट लागू नहीं
वीडियो की ज़्यादा से ज़्यादा अवधि (फ़्रेम और ऑडियो) ~45 मिनट का वीडियो लागू नहीं लागू नहीं
हर अनुरोध में ज़्यादा से ज़्यादा ऑडियो फ़ाइलों की संख्या 1 ऑडियो फ़ाइल लागू नहीं लागू नहीं
ऑडियो कितना लंबा हो सकता है ~8.4 घंटे का ऑडियो लागू नहीं लागू नहीं

* Gemini के सभी मॉडल के लिए, एक टोकन में करीब चार वर्ण होते हैं, इसलिए 100 टोकन, करीब 60 से 80 शब्दों के अंग्रेज़ी के होते हैं. आपके पास कुल संख्या तय करने का विकल्प होता है का उपयोग करके आपके अनुरोधों में टोकन की countTokens.

यहां बताया गया है कि मॉडल कैसे काम करते हैं और इनपुट फ़ाइलें:

मॉडल की वर्शनिंग

Gemini के मॉडल को स्टेबल, अपने-आप अपडेट होने वाले, और झलक में दिखाया जाता है versions.

  • स्टेबल वर्शन को सामान्य रूप से उपलब्ध माना जाता है.

    • स्थिर वर्शन में मॉडल का नाम होता है तीन अंकों वाला वर्शन नंबर डालें, उदाहरण के लिए gemini-1.0-pro-001.
  • अपने-आप अपडेट होने वाले वर्शन हमेशा, इसके सबसे नए स्टेबल वर्शन पर ले जाते हैं वह मॉडल; अगर कोई नया स्टेबल वर्शन रिलीज़ किया गया है, तो अपने-आप अपडेट होने वाला वर्शन अपने-आप उस नए स्थिर वर्शन की ओर पॉइंट करना शुरू कर देता है.

    • अपने-आप अपडेट होने वाले वर्शन में मॉडल का नाम होता है जोड़ें, उदाहरण के लिए gemini-1.0-pro.
  • झलक देखें वर्शन में नई सुविधाएं जोड़ी गई हैं. इसलिए, इन्हें स्टेबल नहीं माना जाता है. ध्यान दें कि झलक वर्शन हमेशा इसके सबसे नए झलक वर्शन पर ले जाते हैं वह मॉडल; अगर झलक का कोई नया वर्शन रिलीज़ किया जाता है, तो झलक दिखाने वाला कोई भी मौजूदा वर्शन अपने-आप उस नए झलक वर्शन पर ले जाना शुरू कर देता है.

    • झलक वाले वर्शन में मॉडल के नाम जोड़े जाते हैं -preview और मॉडल की शुरुआती रिलीज़ तारीख (-MMDD), उदाहरण के लिए gemini-1.5-pro-preview-0409 (9 अप्रैल, 2024 को रिलीज़ किया गया).

ज़्यादा जानने के लिए, Gemini के उपलब्ध वर्शन और उनका लाइफ़साइकल सेक्शन पढ़ें.

उपलब्ध मॉडल के नाम

मॉडल के नाम वे स्पष्ट वैल्यू होते हैं जिन्हें आप अपने कोड में जनरेटिव मॉडल शुरू करना (जो कि Gemini API). अपनी भाषा के शुरुआती उदाहरण देखने के लिए, शुरुआती निर्देश.

Gemini 1.5 Flash मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.5-flash-001 Gemini 1.5 फ़्लैश का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-05-24 24-05-2025 से पहले की नहीं
अपने-आप अपडेट होने वाला वर्शन
gemini-1.5-flash उपयोगकर्ता, 1.5 फ़्लैश
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-flash-001 है)
सामान्य रूप से उपलब्ध 2024-05-24 ---
वर्शन की झलक देखना
gemini-1.5-flash-preview-0514 Gemini 1.5 फ़्लैश के नए वर्शन की झलक सभी के लिए उपलब्ध झलक 2024-05-14 2024-06-24

Gemini 1.5 Pro मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.5-pro-001 Gemini 1.5 Pro का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-05-24 24-05-2025 से पहले की नहीं
अपने-आप अपडेट होने वाला वर्शन
gemini-1.5-pro उपयोगकर्ताओं को 1.5 Pro
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-001 है)
सामान्य रूप से उपलब्ध 2024-05-24 ---
वर्शन की झलक देखना
gemini-1.5-pro-preview-0514 Gemini 1.5 Pro के नए वर्शन की झलक सभी के लिए उपलब्ध झलक 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 gemini-1.5-pro-preview-0514 पर ले जाता है
(यह झलक का सबसे नया वर्शन है)
सभी के लिए उपलब्ध झलक 2024-04-09 2024-06-14

Gemini 1.0 Pro Vision मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-02-15 15-02-2025 से पहले की नहीं है
अपने-आप अपडेट होने वाला वर्शन
gemini-1.0-pro-vision उपयोगकर्ताओं को 1.5 Pro Vision
के नए और स्थिर वर्शन पर ले जाता है (फ़िलहाल, gemini-1.5-pro-vision-001 है)
सामान्य रूप से उपलब्ध 2024-01-04 ---

Gemini 1.0 Pro मॉडल के नाम

मॉडल का नाम जानकारी रिलीज़ का चरण शुरुआती रिलीज़ की तारीख बंद होने की तारीख
स्टेबल वर्शन
gemini-1.0-pro-002 Gemini 1.0 Pro का नया और स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-04-09 09-04-2025 से पहले की नहीं है
gemini-1.0-pro-001 Gemini 1.0 Pro का स्टेबल वर्शन सामान्य रूप से उपलब्ध 2024-02-15 15-02-2025 से पहले की नहीं है
अपने-आप अपडेट होने वाला वर्शन
gemini-1.0-pro उपयोगकर्ताओं को 1.0 Pro
के नए स्टेबल वर्शन पर ले जाता है (फ़िलहाल, gemini-1.0-pro-002 है)
सामान्य रूप से उपलब्ध 2024-02-15 ---

यह सुविधा इन भाषाओं में काम करती है

Gemini के मॉडल को इन भाषाओं में इस्तेमाल किया जा सकता है:

Arabic (ar), Bengali (bn), Bulgarian (bg), Chinese simplified and traditional (zh), Croatian (hr), Czech (cs), Danish (da), Dutch (nl), English (en), Estonian (et), Finnish (fi), French (fr), German (de), Greek (el), Hebrew (iw), Hindi (hi), Hungarian (hu), Indonesian (id), Italian (it), Japanese (ja), Korean (ko), Latvian (lv), Lithuanian (lt), Norwegian (no), Polish (pl), Portuguese (pt), Romanian (ro), Russian (ru), Serbian (sr), Slovak (sk), Slovenian (sl), Spanish (es), Swahili (sw), Swedish (sv), Thai (th), Turkish (tr), Ukrainian (uk), Vietnamese (vi).

अगले चरण

Gemini API की सुविधाओं को आज़माएं