Live API की सीमाएं और खास बातें


इस पेज पर, Live API और उसके मॉडल इस्तेमाल करने से जुड़ी अलग-अलग सीमाओं और खास जानकारी के बारे में बताया गया है.

सेशन से जुड़ी सीमाएं

Live API के लिए, सेशन का मतलब है ऐसा कनेक्शन जो लगातार बना रहता है. इसमें इनपुट और आउटपुट, कनेक्शन के ज़रिए लगातार स्ट्रीम किए जाते हैं.

अगर सेशन, इनमें से किसी भी सीमा से ज़्यादा होता है, तो कनेक्शन खत्म हो जाता है. हालांकि, ध्यान दें कि Live API सेशन से जुड़ी इन सीमाओं को मैनेज करने के लिए कुछ विकल्प उपलब्ध कराता है. इनके बारे में नीचे बताया गया है.

  • सेशन कॉन्टेक्स्ट विंडो की सीमा 1.28 लाख टोकन है.

    कॉन्टेक्स्ट विंडो की इस सीमा की वजह से, इनपुट मोड के आधार पर सेशन की ज़्यादा से ज़्यादा अनुमानित अवधि यहां दी गई है:

    • सिर्फ़ ऑडियो इनपुट वाले सेशन, 15 मिनट तक ही किए जा सकते हैं.
    • वीडियो और ऑडियो इनपुट वाले सेशन, दो मिनट तक ही किए जा सकते हैं.
  • कनेक्शन की अवधि करीब 10 मिनट तक ही हो सकती है.

    कनेक्शन खत्म होने से करीब 60 सेकंड पहले, आपको कनेक्शन खत्म होने की सूचना मिलेगी.

सेशन से जुड़ी सीमाओं को मैनेज करने के लिए, यहां कुछ विकल्प दिए गए हैं:

सेशन मैनेज करने के बारे में ज़्यादा जानें .

रेट की सीमाएं

Live API के लिए, हर Firebase प्रोजेक्ट के लिए एक साथ किए जा सकने वाले सेशन और हर मिनट में इस्तेमाल किए जा सकने वाले टोकन (टीपीएम) की दर की सीमाएं तय की गई हैं.

  • Gemini Developer API:

  • Vertex AI Gemini API:

    • हर Firebase प्रोजेक्ट के लिए, एक साथ 1,000 सेशन किए जा सकते हैं
    • हर मिनट में 40 लाख टोकन इस्तेमाल किए जा सकते हैं

ऑडियो फ़ॉर्मैट

Live API इन ऑडियो फ़ॉर्मैट के साथ काम करता है:

  • इनपुट ऑडियो फ़ॉर्मैट: Raw 16 bit PCM audio at 16kHz little-endian
  • आउटपुट ऑडियो फ़ॉर्मैट: Raw 16 bit PCM audio at 24kHz little-endian

  • इस्तेमाल किए जा सकने वाले MIME टाइप: audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm

इनपुट ऑडियो के सैंपल रेट के बारे में बताने के लिए, ऑडियो वाले हर Blob का MIME टाइप, audio/pcm;rate=16000 जैसी वैल्यू पर सेट करें.

वीडियो फ़ॉर्मैट

Live API अलग-अलग इमेज फ़्रेम की एक सीक्वेन्स पर काम करता है. साथ ही, यह हर सेकंड में एक फ़्रेम (एफ़पीएस) के हिसाब से वीडियो फ़्रेम इनपुट के साथ काम करता है.

  • सुझाया गया इनपुट: 768x768 रिज़ॉल्यूशन पर, हर सेकंड में एक फ़्रेम (एफ़पीएस).

  • इस्तेमाल किए जा सकने वाले MIME टाइप: video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp

ध्यान दें कि इस खास जानकारी की वजह से, Live API उन मामलों के लिए सही नहीं है जिनमें तेज़ी से बदलने वाले वीडियो का विश्लेषण करना ज़रूरी होता है. जैसे, हाई-स्पीड स्पोर्ट्स में प्ले-बाय-प्ले.

जवाब देने के लिए आवाज़ें

Live API जवाब देने के लिए आवाज़ के इन विकल्पों के साथ काम करता है. हर आवाज़ कैसी सुनाई देती है, यह जानने के लिए, देखें Chirp 3: HD voices.

अगर आपने जवाब देने के लिए कोई आवाज़ नहीं चुनी है, तो डिफ़ॉल्ट तौर पर Puck आवाज़ का इस्तेमाल किया जाता है.

जवाब देने के लिए आवाज़ चुनने का तरीका जानें.

Zephyr -- Bright
Kore -- Firm
Orus -- Firm
Autonoe -- Bright
Umbriel -- Easy-going
Erinome -- Clear
Laomedeia -- Upbeat
Schedar -- Even
Achird -- Friendly
Sadachbia -- Lively
Puck -- Upbeat
Fenrir -- Excitable
Aoede -- Breezy
Enceladus -- Breathy
Algieba -- Smooth
Algenib -- Gravelly
Achernar -- Soft
Gacrux -- Mature
Zubenelgenubi -- Casual
Sadaltager -- Knowledgeable
Charon -- Informative
Leda -- Youthful
Callirrhoe -- Easy-going
Iapetus -- Clear
Despina -- Smooth
Rasalgethi -- Informative
Alnilam -- Firm
Pulcherrima -- Forward
Vindemiatrix -- Gentle
Sulafat -- Warm

भाषाएं

Live API इन भाषाओं के साथ काम करता है. जवाब देने के लिए भाषा चुनने का तरीका जानें.

भाषा BCP-47 कोड भाषा BCP-47 कोड
अरबी (मिस्र) ar-EG जर्मन (जर्मनी) de-DE
अंग्रेज़ी (यूएस) en-US स्पेनिश (यूएस) es-US
फ़्रांसीसी (फ़्रांस) fr-FR हिन्दी (भारत) hi-IN
इंडोनेशियन (इंडोनेशिया) id-ID इतालवी (इटली) it-IT
जैपनीज़ (जापान) ja-JP कोरियन (कोरिया) ko-KR
पॉर्चुगीज़ (ब्राज़ील) pt-BR रूसी (रूस) ru-RU
डच (नीदरलैंड्स) nl-NL पोलिश (पोलैंड) pl-PL
थाई (थाईलैंड) th-TH टर्किश (तुर्की) tr-TR
वियतनामीज़ (वियतनाम) vi-VN रोमेनियन (रोमानिया) ro-RO
यूक्रेनियन (यूक्रेन) uk-UA बांग्ला (बांग्लादेश) bn-BD
अंग्रेज़ी (भारत) en-IN और hi-IN बंडल मराठी (भारत) mr-IN
तमिल (भारत) ta-IN तेलुगु (भारत) te-IN