इस पेज पर, Live API और उसके मॉडल इस्तेमाल करने से जुड़ी अलग-अलग सीमाओं और खास जानकारी के बारे में बताया गया है.
सेशन से जुड़ी सीमाएं
Live API के लिए, सेशन का मतलब है ऐसा कनेक्शन जो लगातार बना रहता है. इसमें इनपुट और आउटपुट, कनेक्शन के ज़रिए लगातार स्ट्रीम किए जाते हैं.
अगर सेशन, इनमें से किसी भी सीमा से ज़्यादा होता है, तो कनेक्शन खत्म हो जाता है. हालांकि, ध्यान दें कि Live API सेशन से जुड़ी इन सीमाओं को मैनेज करने के लिए कुछ विकल्प उपलब्ध कराता है. इनके बारे में नीचे बताया गया है.
सेशन कॉन्टेक्स्ट विंडो की सीमा 1.28 लाख टोकन है.
कॉन्टेक्स्ट विंडो की इस सीमा की वजह से, इनपुट मोड के आधार पर सेशन की ज़्यादा से ज़्यादा अनुमानित अवधि यहां दी गई है:
- सिर्फ़ ऑडियो इनपुट वाले सेशन,
15 मिनट तक ही किए जा सकते हैं. - वीडियो और ऑडियो इनपुट वाले सेशन,
दो मिनट तक ही किए जा सकते हैं.
- सिर्फ़ ऑडियो इनपुट वाले सेशन,
कनेक्शन की अवधि करीब
10 मिनट तक ही हो सकती है.कनेक्शन खत्म होने से करीब
60 सेकंड पहले, आपको कनेक्शन खत्म होने की सूचना मिलेगी.
सेशन से जुड़ी सीमाओं को मैनेज करने के लिए, यहां कुछ विकल्प दिए गए हैं:
सेशन कॉन्टेक्स्ट विंडो को कंप्रेस करें ताकि सर्वर, कॉन्टेक्स्ट के साइज़ को अपने-आप सीमा के अंदर बनाए रखे.
सेशन फिर से शुरू करें नेटवर्क के कुछ समय के लिए डिसकनेक्ट होने या कनेक्शन खत्म होने की सूचना मिलने के बाद, बातचीत का कॉन्टेक्स्ट खोने से बचाने के लिए.
सेशन मैनेज करने के बारे में ज़्यादा जानें .
रेट की सीमाएं
Live API के लिए, हर Firebase प्रोजेक्ट के लिए एक साथ किए जा सकने वाले सेशन और हर मिनट में इस्तेमाल किए जा सकने वाले टोकन (टीपीएम) की दर की सीमाएं तय की गई हैं.
Gemini Developer API:
- सीमाएं, आपके प्रोजेक्ट के Gemini Developer API "इस्तेमाल के टियर" के हिसाब से अलग-अलग होती हैं. ज़्यादा जानकारी के लिए, उनकी रेट की सीमाओं से जुड़ा दस्तावेज़ देखें
Vertex AI Gemini API:
- हर Firebase प्रोजेक्ट के लिए, एक साथ 1,000 सेशन किए जा सकते हैं
- हर मिनट में 40 लाख टोकन इस्तेमाल किए जा सकते हैं
ऑडियो फ़ॉर्मैट
Live API इन ऑडियो फ़ॉर्मैट के साथ काम करता है:
- इनपुट ऑडियो फ़ॉर्मैट: Raw 16 bit PCM audio at 16kHz little-endian
आउटपुट ऑडियो फ़ॉर्मैट: Raw 16 bit PCM audio at 24kHz little-endian
इस्तेमाल किए जा सकने वाले MIME टाइप:
audio/x-aac,audio/flac,audio/mp3,audio/m4a,audio/mpeg,audio/mpga,audio/mp4,audio/ogg,audio/pcm,audio/wav,audio/webm
इनपुट ऑडियो के सैंपल रेट के बारे में बताने के लिए, ऑडियो वाले हर Blob का MIME टाइप, audio/pcm;rate=16000 जैसी वैल्यू पर सेट करें.
वीडियो फ़ॉर्मैट
Live API अलग-अलग इमेज फ़्रेम की एक सीक्वेन्स पर काम करता है. साथ ही, यह हर सेकंड में एक फ़्रेम (एफ़पीएस) के हिसाब से वीडियो फ़्रेम इनपुट के साथ काम करता है.
सुझाया गया इनपुट: 768x768 रिज़ॉल्यूशन पर, हर सेकंड में एक फ़्रेम (एफ़पीएस).
इस्तेमाल किए जा सकने वाले MIME टाइप:
video/x-flv,video/quicktime,video/mpeg,video/mpegs,video/mpg,video/mp4,video/webm,video/wmv,video/3gpp
ध्यान दें कि इस खास जानकारी की वजह से, Live API उन मामलों के लिए सही नहीं है जिनमें तेज़ी से बदलने वाले वीडियो का विश्लेषण करना ज़रूरी होता है. जैसे, हाई-स्पीड स्पोर्ट्स में प्ले-बाय-प्ले.
जवाब देने के लिए आवाज़ें
Live API जवाब देने के लिए आवाज़ के इन विकल्पों के साथ काम करता है. हर आवाज़ कैसी सुनाई देती है, यह जानने के लिए, देखें Chirp 3: HD voices.
अगर आपने जवाब देने के लिए कोई आवाज़ नहीं चुनी है, तो डिफ़ॉल्ट तौर पर Puck आवाज़ का इस्तेमाल किया जाता है.
जवाब देने के लिए आवाज़ चुनने का तरीका जानें.
Zephyr -- BrightKore -- FirmOrus -- FirmAutonoe -- BrightUmbriel -- Easy-goingErinome -- ClearLaomedeia -- UpbeatSchedar -- EvenAchird -- FriendlySadachbia -- Lively
|
Puck -- UpbeatFenrir -- ExcitableAoede -- BreezyEnceladus -- BreathyAlgieba -- SmoothAlgenib -- GravellyAchernar -- SoftGacrux -- MatureZubenelgenubi -- CasualSadaltager -- Knowledgeable
|
Charon -- InformativeLeda -- YouthfulCallirrhoe -- Easy-goingIapetus -- ClearDespina -- SmoothRasalgethi -- InformativeAlnilam -- FirmPulcherrima -- ForwardVindemiatrix -- GentleSulafat -- Warm
|
भाषाएं
Live API इन भाषाओं के साथ काम करता है. जवाब देने के लिए भाषा चुनने का तरीका जानें.
| भाषा | BCP-47 कोड | भाषा | BCP-47 कोड |
|---|---|---|---|
| अरबी (मिस्र) | ar-EG | जर्मन (जर्मनी) | de-DE |
| अंग्रेज़ी (यूएस) | en-US | स्पेनिश (यूएस) | es-US |
| फ़्रांसीसी (फ़्रांस) | fr-FR | हिन्दी (भारत) | hi-IN |
| इंडोनेशियन (इंडोनेशिया) | id-ID | इतालवी (इटली) | it-IT |
| जैपनीज़ (जापान) | ja-JP | कोरियन (कोरिया) | ko-KR |
| पॉर्चुगीज़ (ब्राज़ील) | pt-BR | रूसी (रूस) | ru-RU |
| डच (नीदरलैंड्स) | nl-NL | पोलिश (पोलैंड) | pl-PL |
| थाई (थाईलैंड) | th-TH | टर्किश (तुर्की) | tr-TR |
| वियतनामीज़ (वियतनाम) | vi-VN | रोमेनियन (रोमानिया) | ro-RO |
| यूक्रेनियन (यूक्रेन) | uk-UA | बांग्ला (बांग्लादेश) | bn-BD |
| अंग्रेज़ी (भारत) | en-IN और hi-IN बंडल | मराठी (भारत) | mr-IN |
| तमिल (भारत) | ta-IN | तेलुगु (भारत) | te-IN |