इस पेज पर, Live API और इसके मॉडल इस्तेमाल करने से जुड़ी अलग-अलग सीमाओं और खास बातों के बारे में बताया गया है.
सेशन से जुड़ी सीमाएं
Live API के लिए, सेशन का मतलब एक ऐसे कनेक्शन से है जो लगातार बना रहता है. इसमें इनपुट और आउटपुट, कनेक्शन पर लगातार स्ट्रीम किए जाते हैं.
अगर सेशन, यहां दी गई किसी भी सीमा से ज़्यादा होता है, तो कनेक्शन बंद हो जाता है. हालांकि, ध्यान दें कि Live API सेशन से जुड़ी इन सीमाओं को मैनेज करने के लिए कुछ विकल्प देता है. इनके बारे में यहां बताया गया है.
सेशन कॉन्टेक्स्ट विंडो में ज़्यादा से ज़्यादा 1.28 लाख टोकन इस्तेमाल किए जा सकते हैं.
कॉन्टेक्स्ट विंडो की इस सीमा की वजह से, इनपुट मोड के आधार पर सेशन की अनुमानित ज़्यादा से ज़्यादा अवधि यहां दी गई है:
- सिर्फ़ ऑडियो वाले इनपुट सेशन
15 मिनट तक ही किए जा सकते हैं. - वीडियो और ऑडियो इनपुट की अवधि
दो मिनट से ज़्यादा नहीं होनी चाहिए.
- सिर्फ़ ऑडियो वाले इनपुट सेशन
कनेक्शन की अवधि करीब
10 मिनट तक ही होती है.कनेक्शन बंद होने से
60 सेकंड पहले, आपको कनेक्शन बंद होने की सूचना मिलेगी.
सेशन से जुड़ी सीमाओं को मैनेज करने के लिए, यहां कुछ विकल्प दिए गए हैं:
सेशन के कॉन्टेक्स्ट विंडो को कंप्रेस करें, ताकि सर्वर, कॉन्टेक्स्ट के साइज़ को तय सीमा के अंदर अपने-आप बनाए रखे.
सेशन फिर से शुरू करें, ताकि नेटवर्क के कुछ समय के लिए डिसकनेक्ट होने या जा रहे हैं सूचना मिलने के बाद, बातचीत का कॉन्टेक्स्ट न मिटे.
सेशन मैनेज करने के बारे में ज़्यादा जानें.
तय सीमाएं
Live API में, हर Firebase प्रोजेक्ट के लिए एक साथ चल रहे सेशन और हर मिनट के टोकन (टीपीएम) की दर की सीमाएं होती हैं.
Gemini Developer API:
- सीमाएं, आपके प्रोजेक्ट के Gemini Developer API"इस्तेमाल के टियर" के हिसाब से अलग-अलग होती हैं. इसके बारे में जानने के लिए, दर से जुड़ी सीमाओं का दस्तावेज़ देखें
Vertex AI Gemini API:
- हर Firebase प्रोजेक्ट के लिए, एक साथ 1,000 सेशन
- हर मिनट 40 लाख टोकन
ऑडियो फ़ॉर्मैट
Live API इन ऑडियो फ़ॉर्मैट के साथ काम करता है:
- इनपुट ऑडियो फ़ॉर्मैट: रॉ 16 बिट पीसीएम ऑडियो, 16 किलोहर्ट्ज़ लिटिल-एंडियन पर
आउटपुट ऑडियो फ़ॉर्मैट: रॉ 16 बिट पीसीएम ऑडियो, 24 किलोहर्ट्ज़ लिटिल-एंडियन पर
इस्तेमाल किए जा सकने वाले MIME टाइप:
audio/x-aac,audio/flac,audio/mp3,audio/m4a,audio/mpeg,audio/mpga,audio/mp4,audio/ogg,audio/pcm,audio/wav,audio/webm
इनपुट ऑडियो का सैंपल रेट बताने के लिए, ऑडियो वाले हर Blob का एमआईएमई टाइप, audio/pcm;rate=16000 जैसी वैल्यू पर सेट करें.
वीडियो फ़ॉर्मैट
Live API को अलग-अलग इमेज फ़्रेम के क्रम की ज़रूरत होती है. साथ ही, यह एक फ़्रेम प्रति सेकंड (एफ़पीएस) पर वीडियो फ़्रेम के इनपुट को सपोर्ट करता है.
सुझाया गया इनपुट: 768x768 के नेटिव रिज़ॉल्यूशन पर 1 एफ़पीएस.
इस्तेमाल किए जा सकने वाले MIME टाइप:
video/x-flv,video/quicktime,video/mpeg,video/mpegs,video/mpg,video/mp4,video/webm,video/wmv,video/3gpp
ध्यान दें कि इस स्पेसिफ़िकेशन की वजह से, Live API उन इस्तेमाल के उदाहरणों के लिए सही नहीं है जिनमें तेज़ी से बदलते वीडियो का विश्लेषण करना होता है. जैसे, हाई-स्पीड स्पोर्ट्स में प्ले-बाय-प्ले.
जवाब देने के लिए आवाज़ें
Live API में, जवाब देने के लिए आवाज़ के ये विकल्प उपलब्ध हैं. हर आवाज़ कैसी लगती है, इसके डेमो देखने के लिए Chirp 3: एचडी आवाज़ें पर जाएं.
अगर आपने जवाब देने के लिए कोई आवाज़ नहीं चुनी है, तो डिफ़ॉल्ट रूप से Puck का इस्तेमाल किया जाएगा.
जवाब देने के लिए आवाज़ चुनने का तरीका जानें.
Zephyr -- ब्राइटKore -- फ़र्मOrus -- फ़र्मAutonoe -- ब्राइटUmbriel -- ईज़ी-गोइंगErinome -- क्लियरLaomedeia -- अपबीटSchedar -- इवनAchird -- फ़्रेंडलीSadachbia -- लाइवली
|
Puck -- अपबीटFenrir -- उत्साह से भरीAoede -- हल्कीEnceladus -- धीमीAlgieba -- शांतAlgenib -- गंभीरAchernar -- सॉफ़्टGacrux -- समझदारZubenelgenubi -- सामान्यSadaltager -- जानकारी देने वाली
|
Charon -- जानकारी देने वालीLeda -- युवाओं जैसीCallirrhoe -- आसानी से समझ आने वालीIapetus -- स्पष्टDespina -- आरामदायकRasalgethi -- जानकारी देने वालीAlnilam -- आत्मविश्वास से भरीPulcherrima -- आगे बढ़ने के लिए प्रेरित करने वालीVindemiatrix -- नरमSulafat -- दोस्ताना
|
भाषाएं
Live API में इन भाषाओं का इस्तेमाल किया जा सकता है. जवाब की भाषा को अपनी पसंद के मुताबिक सेट करने का तरीका जानें.
| भाषा | BCP-47 कोड | भाषा | BCP-47 कोड |
|---|---|---|---|
| ऐरेबिक (मिस्र) | ar-EG | जर्मन (जर्मनी) | de-DE |
| अंग्रेज़ी (यूएस) | en-US | स्पेनिश (यूएस) | es-US |
| फ़्रांसीसी (फ़्रांस) | fr-FR | हिन्दी (भारत) | hi-IN |
| इंडोनेशियन (इंडोनेशिया) | id-ID | इतालवी (इटली) | it-IT |
| जैपनीज़ (जापान) | ja-JP | कोरियन (कोरिया) | ko-KR |
| पॉर्चुगीज़ (ब्राज़ील) | pt-BR | रूसी (रूस) | ru-RU |
| डच (नीदरलैंड्स) | nl-NL | पोलिश (पोलैंड) | pl-PL |
| थाई (थाईलैंड) | th-TH | टर्किश (तुर्की) | tr-TR |
| वियतनामीज़ (वियतनाम) | vi-VN | रोमेनियन (रोमानिया) | ro-RO |
| यूक्रेनियन (यूक्रेन) | uk-UA | बांग्ला (बांग्लादेश) | bn-BD |
| अंग्रेज़ी (भारत) | en-IN और hi-IN बंडल | मराठी (भारत) | mr-IN |
| तमिल (भारत) | ta-IN | तेलुगु (भारत) | te-IN |