इस पेज पर, Live API और उसके मॉडल के इस्तेमाल से जुड़ी अलग-अलग सीमाओं और खास जानकारी के बारे में बताया गया है.
सेशन से जुड़ी सीमाएं
Live API के लिए, सेशन का मतलब है ऐसा लगातार कनेक्शन जिसमें इनपुट और आउटपुट, कनेक्शन के ज़रिए लगातार स्ट्रीम किए जाते हैं.
अगर सेशन, इनमें से किसी भी सीमा से ज़्यादा होता है, तो कनेक्शन खत्म हो जाता है. हालांकि, ध्यान दें कि Live API सेशन से जुड़ी इन सीमाओं को मैनेज करने के लिए कुछ विकल्प उपलब्ध कराता है. इनके बारे में नीचे बताया गया है.
सेशन कॉन्टेक्स्ट विंडो की सीमा 1.28 लाख टोकन है.
कॉन्टेक्स्ट विंडो की इस सीमा की वजह से, इनपुट मोड के आधार पर सेशन की अनुमानित ज़्यादा से ज़्यादा अवधि यहां दी गई है:
- सिर्फ़ ऑडियो इनपुट वाले सेशन,
15 मिनट तक ही किए जा सकते हैं. - वीडियो और ऑडियो इनपुट वाले सेशन,
दो मिनट तक ही किए जा सकते हैं.
- सिर्फ़ ऑडियो इनपुट वाले सेशन,
कनेक्शन की अवधि करीब
10 मिनट तक ही हो सकती है.कनेक्शन खत्म होने से करीब
60 सेकंड पहले, आपको कनेक्शन खत्म होने की सूचना मिलेगी.
सेशन से जुड़ी सीमाओं को मैनेज करने के लिए, यहां कुछ विकल्प दिए गए हैं:
सेशन कॉन्टेक्स्ट विंडो को कंप्रेस करें ताकि सर्वर, कॉन्टेक्स्ट के साइज़ को अपने-आप सीमा के अंदर बनाए रखे.
सेशन फिर से शुरू करें नेटवर्क के कुछ समय के लिए डिसकनेक्ट होने या कनेक्शन खत्म होने की सूचना मिलने के बाद, बातचीत के कॉन्टेक्स्ट को खोने से बचाने के लिए.
सेशन मैनेज करने के बारे में ज़्यादा जानें .
रेट की सीमाएं
Live API में, हर Firebase प्रोजेक्ट के लिए एक साथ किए जा सकने वाले सेशन के साथ-साथ, हर मिनट में इस्तेमाल किए जा सकने वाले टोकन (टीपीएम) की सीमाएं भी होती हैं.
Gemini Developer API:
- सीमाएं, आपके प्रोजेक्ट के Gemini Developer API "इस्तेमाल के टियर" के आधार पर अलग-अलग होती हैं. ज़्यादा जानकारी के लिए, उनकी रेट की सीमाओं से जुड़ा दस्तावेज़ देखें
Vertex AI Gemini API:
- हर Firebase प्रोजेक्ट के लिए, एक साथ 1,000 सेशन किए जा सकते हैं
- हर मिनट में 40 लाख टोकन इस्तेमाल किए जा सकते हैं
ऑडियो फ़ॉर्मैट
Live API इन ऑडियो फ़ॉर्मैट के साथ काम करता है:
- इनपुट ऑडियो फ़ॉर्मैट: Raw 16 bit PCM audio at 16kHz little-endian
आउटपुट ऑडियो फ़ॉर्मैट: Raw 16 bit PCM audio at 24kHz little-endian
इस्तेमाल किए जा सकने वाले MIME टाइप:
audio/x-aac,audio/flac,audio/mp3,audio/m4a,audio/mpeg,audio/mpga,audio/mp4,audio/ogg,audio/pcm,audio/wav,audio/webm
इनपुट ऑडियो के सैंपल रेट के बारे में बताने के लिए, ऑडियो वाले हर Blob का MIME टाइप, audio/pcm;rate=16000 जैसी वैल्यू पर सेट करें.
वीडियो फ़ॉर्मैट
Live API को अलग-अलग इमेज फ़्रेम की एक सीक्वेन्स की ज़रूरत होती है. साथ ही, यह वीडियो फ़्रेम इनपुट के साथ काम करता है, जो हर सेकंड में एक फ़्रेम (एफ़पीएस) के हिसाब से होता है.
सुझाया गया इनपुट: 768x768 नेटिव रिज़ॉल्यूशन पर, एक एफ़पीएस.
इस्तेमाल किए जा सकने वाले MIME टाइप:
video/x-flv,video/quicktime,video/mpeg,video/mpegs,video/mpg,video/mp4,video/webm,video/wmv,video/3gpp
ध्यान दें कि इस खास जानकारी की वजह से, Live API उन इस्तेमाल के मामलों के लिए सही नहीं है जिनमें तेज़ी से बदलने वाले वीडियो का विश्लेषण करना ज़रूरी होता है. जैसे, हाई-स्पीड स्पोर्ट्स में प्ले-बाय-प्ले.
जवाब देने के लिए आवाज़ें
Live API जवाब देने के लिए आवाज़ के इन विकल्पों के साथ काम करता है. हर आवाज़ कैसी सुनाई देती है, यह जानने के लिए, देखें Chirp 3: HD voices.
अगर आपने जवाब देने के लिए कोई आवाज़ नहीं चुनी है, तो डिफ़ॉल्ट तौर पर Puck आवाज़ का इस्तेमाल किया जाता है.
जवाब देने के लिए आवाज़ चुनने का तरीका जानें.
Zephyr -- BrightKore -- FirmOrus -- FirmAutonoe -- BrightUmbriel -- Easy-goingErinome -- ClearLaomedeia -- UpbeatSchedar -- EvenAchird -- FriendlySadachbia -- Lively
|
Puck -- UpbeatFenrir -- ExcitableAoede -- BreezyEnceladus -- BreathyAlgieba -- SmoothAlgenib -- GravellyAchernar -- SoftGacrux -- MatureZubenelgenubi -- CasualSadaltager -- Knowledgeable
|
Charon -- InformativeLeda -- YouthfulCallirrhoe -- Easy-goingIapetus -- ClearDespina -- SmoothRasalgethi -- InformativeAlnilam -- FirmPulcherrima -- ForwardVindemiatrix -- GentleSulafat -- Warm
|
भाषाएं
Live API इन भाषाओं के साथ काम करता है. जवाब देने के लिए भाषा चुनने का तरीका जानें.
| भाषा | BCP-47 कोड | भाषा | BCP-47 कोड |
|---|---|---|---|
| अरबी (मिस्र) | ar-EG | जर्मन (जर्मनी) | de-DE |
| अंग्रेज़ी (यूएस) | en-US | स्पेनिश (यूएस) | es-US |
| फ़्रांसीसी (फ़्रांस) | fr-FR | हिन्दी (भारत) | hi-IN |
| इंडोनेशियन (इंडोनेशिया) | id-ID | इतालवी (इटली) | it-IT |
| जैपनीज़ (जापान) | ja-JP | कोरियन (कोरिया) | ko-KR |
| पॉर्चुगीज़ (ब्राज़ील) | pt-BR | रूसी (रूस) | ru-RU |
| डच (नीदरलैंड्स) | nl-NL | पोलिश (पोलैंड) | pl-PL |
| थाई (थाईलैंड) | th-TH | टर्किश (तुर्की) | tr-TR |
| वियतनामीज़ (वियतनाम) | vi-VN | रोमेनियन (रोमानिया) | ro-RO |
| यूक्रेनियन (यूक्रेन) | uk-UA | बांग्ला (बांग्लादेश) | bn-BD |
| अंग्रेज़ी (भारत) | en-IN और hi-IN बंडल | मराठी (भारत) | mr-IN |
| तमिल (भारत) | ta-IN | तेलुगु (भारत) | te-IN |