Live API की सीमाएं और खास बातें


इस पेज पर, Live API और उसके मॉडल इस्तेमाल करने से जुड़ी अलग-अलग सीमाओं और खास जानकारी के बारे में बताया गया है.

सेशन से जुड़ी सीमाएं

Live API के लिए, सेशन का मतलब है ऐसा कनेक्शन जो लगातार बना रहता है. इसमें इनपुट और आउटपुट, कनेक्शन के ज़रिए लगातार स्ट्रीम किए जाते हैं.

अगर सेशन, यहां दी गई किसी भी सीमा से ज़्यादा होता है, तो कनेक्शन खत्म हो जाता है. हालांकि, ध्यान दें कि Live API सेशन से जुड़ी इन सीमाओं को मैनेज करने के लिए कुछ विकल्प उपलब्ध कराता है. इनके बारे में नीचे बताया गया है.

  • सेशन कॉन्टेक्स्ट विंडो 1,28,000 टोकन तक सीमित है.

    कॉन्टेक्स्ट विंडो की इस सीमा की वजह से, इनपुट मोड के आधार पर सेशन की ज़्यादा से ज़्यादा अनुमानित अवधि यहां दी गई है:

    • सिर्फ़ ऑडियो इनपुट वाले सेशन, 15 मिनट तक सीमित हैं.
    • वीडियो + ऑडियो इनपुट वाले सेशन, दो मिनट तक सीमित हैं.
  • कनेक्शन की अवधि करीब 10 मिनट तक सीमित है.

    कनेक्शन खत्म होने से करीब 60 सेकंड पहले, आपको कनेक्शन खत्म होने की सूचना मिलेगी.

सेशन से जुड़ी सीमाओं को मैनेज करने के लिए, यहां कुछ विकल्प दिए गए हैं:

सेशन मैनेज करने के बारे में ज़्यादा जानें .

रेट की सीमाएं

Live API में, हर Firebase प्रोजेक्ट के लिए एक साथ चलने वाले सेशन के साथ-साथ, हर मिनट में टोकन (टीपीएम) के लिए भी रेट की सीमाएं होती हैं.

  • Gemini Developer API:

  • Vertex AI Gemini API:

    • हर Firebase प्रोजेक्ट के लिए, एक साथ 1,000 सेशन
    • हर मिनट में 40 लाख टोकन

ऑडियो फ़ॉर्मैट

Live API इन ऑडियो फ़ॉर्मैट के साथ काम करता है:

  • इनपुट ऑडियो फ़ॉर्मैट: रॉ 16 बिट पीसीएम ऑडियो, 16kHz लिटिल-एंडियन
  • आउटपुट ऑडियो फ़ॉर्मैट: रॉ 16 बिट पीसीएम ऑडियो, 24kHz लिटिल-एंडियन

  • इस्तेमाल किए जा सकने वाले MIME टाइप: audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm

इनपुट ऑडियो के सैंपल रेट के बारे में बताने के लिए, ऑडियो वाले हर Blob का एमआईएमई टाइप, audio/pcm;rate=16000 जैसी वैल्यू पर सेट करें.

वीडियो फ़ॉर्मैट

Live API को अलग-अलग इमेज फ़्रेम की एक सीक्वेन्स की ज़रूरत होती है. यह वीडियो फ़्रेम इनपुट के साथ काम करता है, जो हर सेकंड में एक फ़्रेम (एफ़पीएस) के हिसाब से होता है.

  • सुझाया गया इनपुट: 768x768 रिज़ॉल्यूशन, हर सेकंड में एक फ़्रेम (एफ़पीएस).

  • इस्तेमाल किए जा सकने वाले MIME टाइप: video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp

ध्यान दें कि इस खास जानकारी की वजह से, Live API उन इस्तेमाल के मामलों के लिए सही नहीं है जिनमें तेज़ी से बदलने वाले वीडियो का विश्लेषण करना ज़रूरी होता है. जैसे, हाई-स्पीड स्पोर्ट्स में प्ले-बाय-प्ले.

जवाब देने के लिए आवाज़ें

Live API जवाब देने के लिए आवाज़ के इन विकल्पों के साथ काम करता है. हर आवाज़ कैसी सुनाई देती है, यह जानने के लिए, देखें Chirp 3: HD voices.

अगर आपने जवाब देने के लिए कोई आवाज़ नहीं चुनी है, तो डिफ़ॉल्ट तौर पर Puck आवाज़ का इस्तेमाल किया जाता है.

जवाब देने के लिए आवाज़ चुनने का तरीका जानें.

Zephyr -- तेज़
Kore -- मज़बूत
Orus -- मज़बूत
Autonoe -- तेज़
Umbriel -- आराम से बात करने वाली
Erinome -- साफ़
Laomedeia -- खुशमिज़ाज
Schedar -- शांत
Achird -- दोस्ताना
Sadachbia -- ज़िंदादिल
Puck -- खुशमिज़ाज
Fenrir -- उत्साही
Aoede -- हल्की
Enceladus -- धीमी
Algieba -- स्मूद
Algenib -- भारी
Achernar -- सॉफ़्ट
Gacrux -- समझदार
Zubenelgenubi -- कैज़ुअल
Sadaltager -- जानकारी देने वाली
Charon -- जानकारी देने वाली
Leda -- युवा
Callirrhoe -- आराम से बात करने वाली
Iapetus -- साफ़
Despina -- स्मूद
Rasalgethi -- जानकारी देने वाली
Alnilam -- मज़बूत
Pulcherrima -- तेज़
Vindemiatrix -- नरम
Sulafat -- गर्मजोश

भाषाएं

Live API इन भाषाओं के साथ काम करता है. जवाब देने के लिए भाषा चुनने का तरीका जानें.

भाषा BCP-47 कोड भाषा BCP-47 कोड
अरबी (मिस्र) ar-EG जर्मन (जर्मनी) de-DE
अंग्रेज़ी (यूएस) en-US स्पेनिश (यूएस) es-US
फ़्रांसीसी (फ़्रांस) fr-FR हिन्दी (भारत) hi-IN
इंडोनेशियन (इंडोनेशिया) id-ID इतालवी (इटली) it-IT
जैपनीज़ (जापान) ja-JP कोरियन (कोरिया) ko-KR
पॉर्चुगीज़ (ब्राज़ील) pt-BR रूसी (रूस) ru-RU
डच (नीदरलैंड्स) nl-NL पोलिश (पोलैंड) pl-PL
थाई (थाईलैंड) th-TH टर्किश (तुर्की) tr-TR
वियतनामीज़ (वियतनाम) vi-VN रोमेनियन (रोमानिया) ro-RO
यूक्रेनियन (यूक्रेन) uk-UA बांग्ला (बांग्लादेश) bn-BD
अंग्रेज़ी (भारत) en-IN और hi-IN बंडल मराठी (भारत) mr-IN
तमिल (भारत) ta-IN तेलुगु (भारत) te-IN