Limits und Spezifikationen der Live API


Auf dieser Seite werden verschiedene Limits und Spezifikationen für die Verwendung der Live API und ihrer Modelle beschrieben.

Sitzungsbezogene Limits

Bei der Live API bezieht sich eine Sitzung auf eine dauerhafte Verbindung, bei der Eingaben und Ausgaben kontinuierlich über dieselbe Verbindung gestreamt werden.

Wenn die Sitzung eines der folgenden Limits überschreitet, wird die Verbindung beendet.

  • Die Verbindungslänge ist auf etwa 10 Minuten begrenzt.

  • Die Sitzungslänge hängt von den Eingabemodalitäten ab:

    • Sitzungen mit reiner Audioeingabe sind auf 15 Minuten begrenzt.
    • Sitzungen mit Video- und Audioeingabe sind auf 2 Minuten begrenzt.
  • Das Kontextfenster der Sitzung ist auf 128.000 Tokens begrenzt.

Sie erhalten eine Benachrichtigung über die bevorstehende Beendigung, bevor die Verbindung beendet wird. So können Sie weitere Maßnahmen ergreifen.

Weitere Informationen zum Verwalten von Sitzungen.

Ratenlimits

Die Live API hat Ratenlimits für gleichzeitige Sitzungen pro Firebase-Projekt und für Tokens pro Minute (TPM).

  • Gemini Developer API:

    • Die Limits variieren je nach Gemini Developer API "Nutzungsklasse" der Gemini Developer API Ihres Projekts. Weitere Informationen finden Sie in der Dokumentation zu den Ratenlimits.
  • Vertex AI Gemini API:

    • 1.000 gleichzeitige Sitzungen pro Firebase-Projekt
    • 4 Millionen Tokens pro Minute

Audioformate

Die Live API unterstützt die folgenden Audioformate:

  • Audioformat für die Eingabe:rohes 16-Bit-PCM-Audio mit 16 kHz, Little Endian
  • Audioformat für die Ausgabe:rohes 16-Bit-PCM-Audio mit 24 kHz, Little Endian

  • Unterstützte MIME-Typen: audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm

Um die Abtastrate von Audioeingaben anzugeben, legen Sie den MIME-Typ jedes Blobs mit Audio auf einen Wert wie audio/pcm;rate=16000 fest.

Videoformate

Die Live API erwartet eine Sequenz diskreter Bildframes und unterstützt die Eingabe von Video frames mit 1 Frame pro Sekunde (FPS).

  • Empfohlene Eingabe: native Auflösung von 768 × 768 bei 1 FPS.

  • Unterstützte MIME-Typen: video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp

Aufgrund dieser Spezifikation ist die Live API nicht für Anwendungsfälle geeignet, bei denen schnell wechselnde Videos analysiert werden müssen, z. B. für Spielberichte bei rasanten Sportarten.

Stimmen für Antworten

Die Live API unterstützt die folgenden Optionen für die Stimme der Antwort. Demos der einzelnen Stimmen finden Sie unter Chirp 3: HD-Stimmen.

Wenn Sie keine Stimme für die Antwort angeben, wird standardmäßig Puck verwendet.

Informationen zum Angeben der Stimme für die Antwort

Zephyr -- Helle Stimme
Kore -- Feste Stimme
Orus -- Feste Stimme
Autonoe -- Helle Stimme
Umbriel -- Lässige Stimme
Erinome -- Klare Stimme
Laomedeia -- Fröhliche Stimme
Schedar -- Gleichmäßige Stimme
Achird -- Freundliche Stimme
Sadachbia -- Lebhafte Stimme
Puck -- Fröhliche Stimme
Fenrir -- Aufgeregte Stimme
Aoede -- Leichte Stimme
Enceladus -- Hauchige Stimme
Algieba -- Sanfte Stimme
Algenib -- Rauhe Stimme
Achernar -- Leise Stimme
Gacrux -- Reife Stimme
Zubenelgenubi -- Lässige Stimme
Sadaltager -- Wissende Stimme
Charon -- Informative Stimme
Leda -- Junge Stimme
Callirrhoe -- Lässige Stimme
Iapetus -- Klare Stimme
Despina -- Sanfte Stimme
Rasalgethi -- Informative Stimme
Alnilam -- Feste Stimme
Pulcherrima -- Direkte Stimme
Vindemiatrix -- Sanfte Stimme
Sulafat -- Warme Stimme

Sprachen

Die Live API unterstützt die folgenden Sprachen. Informationen zum Beeinflussen der Sprache der Antwort .

Sprache BCP-47-Code Sprache BCP-47-Code
Arabisch (Ägypten) ar-EG Deutsch (Deutschland) de-DE
Englisch (USA) en-US Spanisch (USA) es-US
Französisch (Frankreich) fr-FR Hindi (Indien) hi-IN
Indonesisch (Indonesien) id-ID Italienisch (Italien) it-IT
Japanisch (Japan) ja-JP Koreanisch (Korea) ko-KR
Portugiesisch (Brasilien) pt-BR Russisch (Russland) ru-RU
Niederländisch (Niederlande) nl-NL Polnisch (Polen) pl-PL
Thailändisch (Thailand) th-TH Türkisch (Türkei) tr-TR
Vietnamesisch (Vietnam) vi-VN Rumänisch (Rumänien) ro-RO
Ukrainisch (Ukraine) uk-UA Bengalisch (Bangladesch) bn-BD
Englisch (Indien) en-IN &hi-IN bundle Marathi (Indien) mr-IN
Tamil (Indien) ta-IN Telugu (Indien) te-IN