حدود ومواصفات Live API


توضّح هذه الصفحة الحدود والمواصفات المختلفة لاستخدام Live API ونماذجه.

الحدود القصوى المتعلّقة بالجلسات

بالنسبة إلى Live API، تشير الجلسة إلى اتصال دائم يتم فيه بث البيانات المدخلة والمخرجة بشكل مستمر عبر الاتصال نفسه.

إذا تجاوزت الجلسة أيًا من الحدود التالية، سيتم إنهاء الاتصال.

  • تقتصر مدة الاتصال على 10 دقائق تقريبًا.

  • تعتمد مدة الجلسة على طرق الإدخال التالية:

    • تقتصر مدة جلسات الإدخال الصوتي فقط على 15 دقيقة.
    • تقتصر مدة الفيديو والصوت على دقيقتَين.
  • يقتصر عدد الرموز المميزة المستندة إلى السياق في الجلسة على 128 ألف رمز مميز.

حدود معدّل الاستخدام

يفرض Live API حدودًا على معدّل الجلسات المتزامنة لكل مشروع في Firebase، بالإضافة إلى عدد الرموز المميزة في الدقيقة (TPM).

  • Gemini Developer API:

  • Vertex AI Gemini API:

    • ‫1,000 جلسة متزامنة لكل مشروع على Firebase
    • ‫4 مليون رمز مميّز في الدقيقة

تنسيقات الصوت

يتوافق Live API مع تنسيقات الصوت التالية:

  • تنسيق الصوت المُدخَل: صوت PCM خام بمعدّل 16 بت و16 كيلوهرتز بنظام الترتيب الصغير
  • تنسيق إخراج الصوت: صوت PCM خام 16 بت بترتيب وحدات البايت الأصغر أولاً بمعدل 24 كيلوهرتز

  • أنواع MIME المتوافقة: audio/x-aac وaudio/flac وaudio/mp3 وaudio/m4a وaudio/mpeg وaudio/mpga وaudio/mp4 وaudio/ogg وaudio/pcm وaudio/wav وaudio/webm

لتحديد معدّل عيّنات الصوت المُدخَل، اضبط نوع MIME لكل Blob يحتوي على صوت على قيمة مثل audio/pcm;rate=16000.

أشكال إعلانات الفيديو

تتوقّع Live API تسلسلاً من لقطات الصور المنفصلة وتتيح إدخال لقطات الفيديو بمعدّل لقطة واحدة في الثانية.

  • البيانات المُدخَلة المقترَحة: دقة 768x768 الأصلية بمعدّل لقطة واحدة في الثانية.

  • أنواع MIME المتوافقة: video/x-flv وvideo/quicktime وvideo/mpeg وvideo/mpegs وvideo/mpg وvideo/mp4 وvideo/webm وvideo/wmv وvideo/3gpp

يُرجى العِلم أنّ هذه المواصفات تجعل Live API غير مناسبة لحالات الاستخدام التي تتطلّب تحليل فيديو سريع التغيّر، مثل اللقطات السريعة في المباريات الرياضية.

أصوات الردود

يتوافق Live API مع خيارات الصوت التالية للردود. للحصول على عيّنات من كل صوت، يُرجى الاطّلاع على Chirp 3: أصوات عالية الدقة.

إذا لم تحدّد صوتًا للردّ، سيكون الصوت التلقائي هو Puck.

كيفية تحديد صوت الرد

Zephyr -- مشرق
Kore -- حازم
Orus -- حازم
Autonoe -- مشرق
Umbriel -- هادئ
Erinome -- واضح
Laomedeia -- مبهج
Schedar -- متوازن
Achird -- ودود
Sadachbia -- حيوي
Puck -- مفعم بالحيوية
Fenrir -- متحمّس
Aoede -- هادئ
Enceladus -- مريح
Algieba -- ناعم
Algenib -- خشن
Achernar -- لطيف
Gacrux -- ناضج
Zubenelgenubi -- عادي
Sadaltager -- مُطّلع
Charon -- مفيد
Leda -- حيوي
Callirrhoe -- هادئ
Iapetus -- واضح
Despina -- سلس
Rasalgethi -- مفيد
Alnilam -- حازم
Pulcherrima -- مقدام
Vindemiatrix -- لطيف
Sulafat -- دافئ

اللغات

يتوفّر Live API باللغات التالية. كيفية التأثير في لغة الردّ

اللغة رمز BCP-47 اللغة رمز BCP-47
العربية (مصر) ar-EG الألمانية (ألمانيا) de-DE
الإنجليزية (الولايات المتحدة) en-US الإسبانية (الولايات المتحدة) es-US
الفرنسية (فرنسا) fr-FR الهندية (الهند) hi-IN
الإندونيسية (إندونيسيا) id-ID الإيطالية (إيطاليا) it-IT
اليابانية (اليابان) ja-JP الكورية (كوريا) ko-KR
البرتغالية (البرازيل) pt-BR الروسية (روسيا) ru-RU
الهولندية (هولندا) nl-NL البولندية (بولندا) pl-PL
التايلاندية (تايلاند) th-TH التركية (تركيا) tr-TR
الفيتنامية (فيتنام) vi-VN الرومانية (رومانيا) ro-RO
الأوكرانية (أوكرانيا) uk-UA البنغالية‬ (بنغلاديش) bn-BD
الإنجليزية (الهند) حزمة en-IN وhi-IN الماراثية (الهند) mr-IN
التاميلية‬ (الهند) ta-IN التيلوغوية (الهند) te-IN