इस पेज पर, Live API और उसके मॉडल इस्तेमाल करने से जुड़ी अलग-अलग सीमाओं और खास जानकारी के बारे में बताया गया है.
सेशन से जुड़ी सीमाएं
Live API के लिए, सेशन का मतलब है ऐसा कनेक्शन जो लगातार बना रहता है. इसमें इनपुट और आउटपुट, कनेक्शन के ज़रिए लगातार स्ट्रीम किए जाते हैं.
अगर सेशन, यहां दी गई किसी भी सीमा से ज़्यादा होता है, तो कनेक्शन खत्म हो जाता है. हालांकि, ध्यान दें कि Live API सेशन से जुड़ी इन सीमाओं को मैनेज करने के लिए कुछ विकल्प उपलब्ध कराता है. इनके बारे में नीचे बताया गया है.
सेशन कॉन्टेक्स्ट विंडो 1,28,000 टोकन तक सीमित है.
कॉन्टेक्स्ट विंडो की इस सीमा की वजह से, इनपुट मोड के आधार पर सेशन की ज़्यादा से ज़्यादा अनुमानित अवधि यहां दी गई है:
- सिर्फ़ ऑडियो इनपुट वाले सेशन,
15 मिनट तक सीमित हैं. - वीडियो + ऑडियो इनपुट वाले सेशन,
दो मिनट तक सीमित हैं.
- सिर्फ़ ऑडियो इनपुट वाले सेशन,
कनेक्शन की अवधि करीब
10 मिनट तक सीमित है.कनेक्शन खत्म होने से करीब
60 सेकंड पहले, आपको कनेक्शन खत्म होने की सूचना मिलेगी.
सेशन से जुड़ी सीमाओं को मैनेज करने के लिए, यहां कुछ विकल्प दिए गए हैं:
सेशन कॉन्टेक्स्ट विंडो को कंप्रेस करें ताकि सर्वर, कॉन्टेक्स्ट के साइज़ को अपने-आप सीमा के अंदर बनाए रखे.
सेशन फिर से शुरू करें नेटवर्क के कुछ समय के लिए डिसकनेक्ट होने या कनेक्शन खत्म होने की सूचना मिलने के बाद, बातचीत का कॉन्टेक्स्ट खोने से बचाने के लिए.
सेशन मैनेज करने के बारे में ज़्यादा जानें .
रेट की सीमाएं
Live API में, हर Firebase प्रोजेक्ट के लिए एक साथ चलने वाले सेशन के साथ-साथ, हर मिनट में टोकन (टीपीएम) के लिए भी रेट की सीमाएं होती हैं.
Gemini Developer API:
- सीमाएं, आपके प्रोजेक्ट के Gemini Developer API "इस्तेमाल के टियर" के आधार पर अलग-अलग होती हैं. ज़्यादा जानकारी के लिए, उनकी रेट की सीमाओं से जुड़ा दस्तावेज़ देखें
Vertex AI Gemini API:
- हर Firebase प्रोजेक्ट के लिए, एक साथ 1,000 सेशन
- हर मिनट में 40 लाख टोकन
ऑडियो फ़ॉर्मैट
Live API इन ऑडियो फ़ॉर्मैट के साथ काम करता है:
- इनपुट ऑडियो फ़ॉर्मैट: रॉ 16 बिट पीसीएम ऑडियो, 16kHz लिटिल-एंडियन
आउटपुट ऑडियो फ़ॉर्मैट: रॉ 16 बिट पीसीएम ऑडियो, 24kHz लिटिल-एंडियन
इस्तेमाल किए जा सकने वाले MIME टाइप:
audio/x-aac,audio/flac,audio/mp3,audio/m4a,audio/mpeg,audio/mpga,audio/mp4,audio/ogg,audio/pcm,audio/wav,audio/webm
इनपुट ऑडियो के सैंपल रेट के बारे में बताने के लिए, ऑडियो वाले हर Blob का एमआईएमई टाइप, audio/pcm;rate=16000 जैसी वैल्यू पर सेट करें.
वीडियो फ़ॉर्मैट
Live API को अलग-अलग इमेज फ़्रेम की एक सीक्वेन्स की ज़रूरत होती है. यह वीडियो फ़्रेम इनपुट के साथ काम करता है, जो हर सेकंड में एक फ़्रेम (एफ़पीएस) के हिसाब से होता है.
सुझाया गया इनपुट: 768x768 रिज़ॉल्यूशन, हर सेकंड में एक फ़्रेम (एफ़पीएस).
इस्तेमाल किए जा सकने वाले MIME टाइप:
video/x-flv,video/quicktime,video/mpeg,video/mpegs,video/mpg,video/mp4,video/webm,video/wmv,video/3gpp
ध्यान दें कि इस खास जानकारी की वजह से, Live API उन इस्तेमाल के मामलों के लिए सही नहीं है जिनमें तेज़ी से बदलने वाले वीडियो का विश्लेषण करना ज़रूरी होता है. जैसे, हाई-स्पीड स्पोर्ट्स में प्ले-बाय-प्ले.
जवाब देने के लिए आवाज़ें
Live API जवाब देने के लिए आवाज़ के इन विकल्पों के साथ काम करता है. हर आवाज़ कैसी सुनाई देती है, यह जानने के लिए, देखें Chirp 3: HD voices.
अगर आपने जवाब देने के लिए कोई आवाज़ नहीं चुनी है, तो डिफ़ॉल्ट तौर पर Puck आवाज़ का इस्तेमाल किया जाता है.
जवाब देने के लिए आवाज़ चुनने का तरीका जानें.
Zephyr -- तेज़Kore -- मज़बूतOrus -- मज़बूतAutonoe -- तेज़Umbriel -- आराम से बात करने वालीErinome -- साफ़Laomedeia -- खुशमिज़ाजSchedar -- शांतAchird -- दोस्तानाSadachbia -- ज़िंदादिल
|
Puck -- खुशमिज़ाजFenrir -- उत्साहीAoede -- हल्कीEnceladus -- धीमीAlgieba -- स्मूदAlgenib -- भारीAchernar -- सॉफ़्टGacrux -- समझदारZubenelgenubi -- कैज़ुअलSadaltager -- जानकारी देने वाली
|
Charon -- जानकारी देने वालीLeda -- युवाCallirrhoe -- आराम से बात करने वालीIapetus -- साफ़Despina -- स्मूदRasalgethi -- जानकारी देने वालीAlnilam -- मज़बूतPulcherrima -- तेज़Vindemiatrix -- नरमSulafat -- गर्मजोश
|
भाषाएं
Live API इन भाषाओं के साथ काम करता है. जवाब देने के लिए भाषा चुनने का तरीका जानें.
| भाषा | BCP-47 कोड | भाषा | BCP-47 कोड |
|---|---|---|---|
| अरबी (मिस्र) | ar-EG | जर्मन (जर्मनी) | de-DE |
| अंग्रेज़ी (यूएस) | en-US | स्पेनिश (यूएस) | es-US |
| फ़्रांसीसी (फ़्रांस) | fr-FR | हिन्दी (भारत) | hi-IN |
| इंडोनेशियन (इंडोनेशिया) | id-ID | इतालवी (इटली) | it-IT |
| जैपनीज़ (जापान) | ja-JP | कोरियन (कोरिया) | ko-KR |
| पॉर्चुगीज़ (ब्राज़ील) | pt-BR | रूसी (रूस) | ru-RU |
| डच (नीदरलैंड्स) | nl-NL | पोलिश (पोलैंड) | pl-PL |
| थाई (थाईलैंड) | th-TH | टर्किश (तुर्की) | tr-TR |
| वियतनामीज़ (वियतनाम) | vi-VN | रोमेनियन (रोमानिया) | ro-RO |
| यूक्रेनियन (यूक्रेन) | uk-UA | बांग्ला (बांग्लादेश) | bn-BD |
| अंग्रेज़ी (भारत) | en-IN और hi-IN बंडल | मराठी (भारत) | mr-IN |
| तमिल (भारत) | ta-IN | तेलुगु (भारत) | te-IN |