Usługa Gemini Live API przetwarza ciągłe strumienie audio lub tekstu, które nazywamy sesjami. Możesz zarządzać cyklem życia sesji, od początkowego uzgadniania połączenia po prawidłowe zakończenie.
Limity sesji
W przypadku Live API sesja to trwałe połączenie, w którym dane wejściowe i wyjściowe są przesyłane strumieniowo w sposób ciągły.
Jeśli sesja przekroczy którykolwiek z tych limitów, połączenie zostanie zakończone. Pamiętaj jednak, że Live API udostępnia kilka opcji (patrz poniżej), które pozwalają radzić sobie z tymi limitami związanymi z sesjami.
Okno kontekstu sesji jest ograniczone do 128 tys. tokenów.
Ze względu na limit okna kontekstu podajemy przybliżone maksymalne długości sesji w zależności od rodzaju danych wejściowych:
- Sesje wejściowe tylko z dźwiękiem są ograniczone do
15 minut . - Wejście wideo i audio jest ograniczone do
2 minut .
- Sesje wejściowe tylko z dźwiękiem są ograniczone do
Długość połączenia jest ograniczona do około
10 minut .Otrzymasz powiadomienie o wycofaniu na
60 sekund przed zakończeniem połączenia.
Oto kilka opcji radzenia sobie z limitami związanymi z sesjami:
Kompresuj okno kontekstu sesji, aby serwer automatycznie utrzymywał rozmiar kontekstu w ramach limitu.
Wznów sesję, aby uniknąć utraty kontekstu rozmowy podczas krótkich przerw w połączeniu z siecią lub po otrzymaniu powiadomienia o opuszczeniu.
Rozpocznij sesję
Więcej informacji o tym, jak rozpocząć sesję, znajdziesz w przewodniku dla początkujących dotyczącym Live API.
Aktualizacja w trakcie sesji
Modele Live API obsługują te zaawansowane funkcje aktualizacji w trakcie sesji:
Instrukcje aktualizacji systemu (tylko w przypadku Vertex AI Gemini API)
Dodawanie przyrostowych aktualizacji treści
Podczas aktywnej sesji możesz dodawać aktualizacje przyrostowe. Użyj tej funkcji, aby wysłać dane wejściowe w postaci tekstu, utworzyć kontekst sesji lub przywrócić kontekst sesji.
W przypadku dłuższych kontekstów zalecamy podanie podsumowania pojedynczej wiadomości, aby zwolnić okno kontekstu na potrzeby kolejnych interakcji.
W przypadku krótkich kontekstów możesz wysyłać interakcje krok po kroku, aby przedstawić dokładną sekwencję zdarzeń, tak jak w poniższym fragmencie kodu.
Swift
// Define initial turns (history/context).
let turns: [ModelContent] = [
ModelContent(role: "user", parts: [TextPart("What is the capital of France?")]),
ModelContent(role: "model", parts: [TextPart("Paris")]),
]
// Send history, keeping the conversational turn OPEN (false).
await session.sendContent(turns, turnComplete: false)
// Define the new user query.
let newTurn: [ModelContent] = [
ModelContent(role: "user", parts: [TextPart("What is the capital of Germany?")]),
]
// Send the final query, CLOSING the turn (true) to trigger the model response.
await session.sendContent(newTurn, turnComplete: true)
Kotlin
Not yet supported for Android apps - check back soon!
Java
Not yet supported for Android apps - check back soon!
Web
const turns = [{ text: "Hello from the user!" }];
await session.send(
turns,
false // turnComplete: false
);
console.log("Sent history. Waiting for next input...");
// Define the new user query.
const newTurn [{ text: "And what is the capital of Germany?" }];
// Send the final query, CLOSING the turn (true) to trigger the model response.
await session.send(
newTurn,
true // turnComplete: true
);
console.log("Sent final query. Model response expected now.");
Dart
// Define initial turns (history/context).
final List turns = [
Content(
"user",
[Part.text("What is the capital of France?")],
),
Content(
"model",
[Part.text("Paris")],
),
];
// Send history, keeping the conversational turn OPEN (false).
await session.send(
input: turns,
turnComplete: false,
);
// Define the new user query.
final List newTurn = [
Content(
"user",
[Part.text("What is the capital of Germany?")],
),
];
// Send the final query, CLOSING the turn (true) to trigger the model response.
await session.send(
input: newTurn,
turnComplete: true,
);
Unity
// Define initial turns (history/context).
List turns = new List {
new ModelContent("user", new ModelContent.TextPart("What is the capital of France?") ),
new ModelContent("model", new ModelContent.TextPart("Paris") ),
};
// Send history, keeping the conversational turn OPEN (false).
foreach (ModelContent turn in turns)
{
await session.SendAsync(
content: turn,
turnComplete: false
);
}
// Define the new user query.
ModelContent newTurn = ModelContent.Text("What is the capital of Germany?");
// Send the final query, CLOSING the turn (true) to trigger the model response.
await session.SendAsync(
content: newTurn,
turnComplete: true
);
Aktualizowanie instrukcji systemowych w trakcie sesji
| Dostępne tylko wtedy, gdy jako dostawcę interfejsu API używasz Vertex AI Gemini API. |
Instrukcje systemowe możesz aktualizować podczas aktywnej sesji. Użyj tej funkcji, aby dostosować odpowiedzi modelu, np. zmienić język odpowiedzi lub zmodyfikować ton.
Aby zaktualizować instrukcje systemowe w trakcie sesji, możesz wysłać treść tekstową z system role. Zaktualizowane instrukcje systemowe będą obowiązywać do końca sesji.
Swift
await session.sendContent(
[ModelContent(
role: "system",
parts: [TextPart("new system instruction")]
)],
turnComplete: false
)
Kotlin
Not yet supported for Android apps - check back soon!
Java
Not yet supported for Android apps - check back soon!
Web
Not yet supported for Web apps - check back soon!
Dart
try {
await _session.send(
input: Content(
'system',
[Part.text('new system instruction')],
),
turnComplete: false,
);
} catch (e) {
print('Failed to update system instructions: $e');
}
Unity
try
{
await session.SendAsync(
content: new ModelContent(
"system",
new ModelContent.TextPart("new system instruction")
),
turnComplete: false
);
}
catch (Exception e)
{
Debug.LogError($"Failed to update system instructions: {e.Message}");
}
Kompresowanie okna kontekstu
|
Kliknij Gemini API dostawcę, aby wyświetlić na tej stronie treści i kod specyficzne dla tego dostawcy. |
Live API Okno kontekstu sesji przechowuje dane przesyłane strumieniowo w czasie rzeczywistym (25 tokenów na sekundę w przypadku dźwięku i 258 tokenów na sekundę w przypadku wideo), a także inne treści, w tym dane wejściowe w postaci tekstu i dane wyjściowe modelu. Wszystkie modele Live API mają limit okna kontekstu sesji wynoszący 128 tys. tokenów.
Domyślnie ze względu na limit okna kontekstu maksymalna długość sesji w zależności od rodzaju danych wejściowych wynosi w przybliżeniu:
- Sesje wejściowe tylko z dźwiękiem są ograniczone do
15 minut . - Wejście wideo i audio jest ograniczone do
2 minut .
W przypadku długotrwałych sesji w miarę postępu rozmowy gromadzi się historia tokenów audio lub wideo. Jeśli historia przekroczy limit modelu, może on mieć halucynacje, działać wolniej lub sesja może zostać wymuszona.
Aby włączyć dłuższe sesje, możesz włączyć kompresję okna kontekstu, ustawiając pole contextWindowCompression w ramach LiveGenerationConfig. Gdy ta funkcja jest włączona, serwer używa mechanizmu okna przesuwnego, aby automatycznie odrzucać najstarsze tury lub je podsumowywać, tak aby rozmiar kontekstu mieścił się w domyślnych lub określonych limitach. Instrukcje systemowe nie są odrzucane i zawsze pozostają na początku okna kontekstu.
Z punktu widzenia użytkownika pozwala to na teoretycznie nieskończone sesje, ponieważ „pamięć” jest stale zarządzana.
Możesz skonfigurować mechanizm okna przesuwnego, a także opcjonalnie liczbę tokenów, która wywołuje kompresję (patrz dostępne ustawienia i wartości poniżej). Oto kilka ogólnych kwestii, które warto wziąć pod uwagę podczas korzystania z tych ustawień:
Ustawienie
targetTokensna bardzo niską wartość zwolni więcej miejsca na kontekst w przypadku ciągłych strumieni, ale model będzie szybko „zapominać” starsze części rozmowy.Ustawienie wartości
targetTokensbliżejtriggerTokenspozwala zaoszczędzić więcej pamięci, ale znacznie częściej uruchamia procedury kompresji.
| Ustawienie | Domyślna wartość okna przesuwnego, jeśli nie została ustawiona w konfiguracji | Wartość minimalna | Wartość maksymalna |
|---|---|---|---|
triggerTokensdługość kontekstu przed rozpoczęciem kompresji; |
80% limitu okna kontekstu modelu. | 5000 | 128 000 |
targetTokensdocelowa liczba tokenów do zachowania |
50% wartości triggerTokens
|
0 | 128 000 |
Swift
// Initialize the Gemini Developer API backend service
let liveModel = FirebaseAI.firebaseAI(backend: .googleAI()).liveModel(
modelName: "gemini-2.5-flash-native-audio-preview-12-2025",
// Enable context window compression.
// (Optional) Configure the number of tokens in the context window that triggers the compression.
generationConfig: LiveGenerationConfig(
responseModalities: [.audio],
contextWindowCompression: ContextWindowCompressionConfig(
triggerTokens: 10000,
slidingWindow: SlidingWindow(
targetTokens: 2000,
)
)
)
)
Kotlin
// Initialize the Gemini Developer API backend service
val liveModel = Firebase.ai(backend = GenerativeBackend.googleAI()).liveModel(
modelName = "gemini-2.5-flash-native-audio-preview-12-2025",
// Enable context window compression.
// (Optional) Configure the number of tokens in the context window that triggers the compression.
generationConfig = liveGenerationConfig {
responseModality = ResponseModality.AUDIO,
contextWindowCompression = ContextWindowCompressionConfig(
triggerTokens = 10000,
slidingWindow = SlidingWindow(targetTokens = 2000)
)
}
)
Java
// Initialize the Gemini Developer API backend service
LiveGenerativeModel lm = FirebaseAI.getInstance(GenerativeBackend.googleAI()).liveModel(
"gemini-2.5-flash-native-audio-preview-12-2025",
// Enable context window compression.
// (Optional) Configure the number of tokens in the context window that triggers the compression.
new LiveGenerationConfig.Builder()
.setResponseModality(ResponseModality.AUDIO)
.setContextWindowCompression(
new ContextWindowCompressionConfig(10000, new SlidingWindow(2000))
)
.build()
);
Web
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });
const liveModel = getLiveGenerativeModel(ai, {
model: "gemini-2.5-flash-native-audio-preview-12-2025",
// Enable context window compression.
// (Optional) Configure the number of tokens in the context window that triggers the compression.
generationConfig: {
responseModalities: [ResponseModality.AUDIO],
contextWindowCompression: {
triggerTokens: 10000,
slidingWindow: {
targetTokens: 2000,
},
},
},
});
Dart
final _liveModel = FirebaseAI.googleAI().liveGenerativeModel(
model: 'gemini-2.5-flash-native-audio-preview-12-2025',
// Enable context window compression.
// (Optional) Configure the number of tokens in the context window that triggers the compression.
liveGenerationConfig: LiveGenerationConfig(
responseModalities: [ResponseModalities.audio],
contextWindowCompression: ContextWindowCompressionConfig(
triggerTokens: 10000,
slidingWindow: SlidingWindow(targetTokens: 2000),
),
),
);
Unity
var liveModel = FirebaseAI.GetInstance(FirebaseAI.Backend.GoogleAI()).GetLiveModel(
modelName: "gemini-2.5-flash-native-audio-preview-12-2025",
// Enable context window compression.
// (Optional) Configure the number of tokens in the context window that triggers the compression.
liveGenerationConfig: new LiveGenerationConfig(
responseModalities: new[] { ResponseModality.Audio },
contextWindowCompression: new ContextWindowCompressionConfig(
triggerTokens: 10000,
slidingWindow: new SlidingWindow(targetTokens: 2000)
)
)
);
wykrywać, kiedy sesja ma się zakończyć;
Maksymalny czas trwania pojedynczego, ciągłego połączenia WebSocket to około
Poniższy przykład pokazuje, jak wykryć zbliżające się zakończenie połączenia przez nasłuchiwanie powiadomienia going away:
Swift
for try await response in session.responses {
switch response.payload {
case .goingAwayNotice(let goingAwayNotice):
// Prepare for the session to close soon
if let timeLeft = goingAwayNotice.timeLeft {
print("Server going away in \(timeLeft) seconds")
}
}
}
Kotlin
for (response in session.responses) {
when (val message = response.payload) {
is LiveServerGoAway -> {
// Prepare for the session to close soon
val remaining = message.timeLeft
logger.info("Server going away in $remaining")
}
}
}
Java
session.getResponses().forEach(response -> {
if (response.getPayload() instanceof LiveServerResponse.GoingAwayNotice) {
LiveServerResponse.GoingAwayNotice notice = (LiveServerResponse.GoingAwayNotice) response.getPayload();
// Prepare for the session to close soon
Duration timeLeft = notice.getTimeLeft();
}
});
Web
for await (const message of session.receive()) {
switch (message.type) {
...
case "goingAwayNotice":
console.log("Server going away. Time left:", message.timeLeft);
break;
}
}
Dart
Future _handleLiveServerMessage(LiveServerResponse response) async {
final message = response.message;
if (message is GoingAwayNotice) {
// Prepare for the session to close soon
developer.log('Server going away. Time left: ${message.timeLeft}');
}
}
Unity
foreach (var response in session.Responses) {
if (response.Payload is LiveSessionGoingAway notice) {
// Prepare for the session to close soon
TimeSpan timeLeft = notice.TimeLeft;
Debug.Log($"Server going away notice received. Remaining: {timeLeft}");
}
}
Wznawianie sesji
Live API obsługuje wznowienie sesji, aby zapobiec utracie kontekstu rozmowy. Każda sesja ma uchwyt, którego można używać w ten sposób:
Utrzymywanie sesji przed osiągnięciem limitu czasu połączenia
Maksymalny czas trwania pojedynczego, ciągłego połączenia WebSocket to około
10 minut . Możesz wykryć, kiedy połączenie ma się zakończyć, nasłuchując powiadomienia going away, a następnie przedłużyć sesję, nawiązując nowe połączenie za pomocą uchwytu sesji.Wznawianie sesji tuż po utracie połączenia
Jeśli połączenie zostanie przerwane przed upływem maksymalnego czasu trwania połączenia (np. w wyniku przełączenia z Wi-Fi na 5G), serwer zachowa stan sesji przez około
10 minut . W tym czasie możesz wznowić sesję, nawiązując nowe połączenie za pomocą uchwytu sesji.Wznawianie sesji po dłuższym czasie
Po zakończeniu połączenia serwer przechowuje stan sesji przez kilka godzin. W tym czasie możesz wznowić sesję, nawiązując nowe połączenie za pomocą uchwytu sesji. Pamiętaj, że ten przedział czasu jest różny w przypadku 2 dostawców Gemini API:Gemini Developer API
2 godziny | Vertex AI Gemini API24 godziny .
Domyślnie wznawianie sesji jest wyłączone. Aby włączyć wznawianie sesji, podczas nawiązywania nowego połączenia przekaż pustą konfigurację wznawiania. Gdy ta opcja jest włączona, serwer okresowo wysyła aktualizacje zawierające uchwyt wznowienia sesji. Jeśli sesja zostanie rozłączona, możesz ponownie nawiązać połączenie i przekazać ten uchwyt, aby wznowić sesję z zachowaniem jej kontekstu.
Poniższe przykłady pokazują 2 opcje wznowienia sesji:
Swift
// Local variable to save the active session handle
var activeSessionHandle: String?
// Initialize the session. Passing an empty config requests the server to send SessionResumptionUpdate
var session = try await liveModel.connect(
sessionResumption: SessionResumptionConfig()
)
// Start receiving responses
for try await message in session.responses {
// Check for new session handles inside your message handling loop
switch message.payload {
case let .sessionResumptionUpdate(updateMessage):
guard let newHandle = updateMessage.newHandle, updateMessage.resumable else {
continue
}
activeSessionHandle = newHandle
print("SessionResumptionUpdate: handle \(newHandle)")
// ... handle other LiveServerMessage types ...
default:
break
}
}
// The following are alternative options to resume a session. Choose only one.
// Option 1: Create and connect a session to resume with the saved handle
if let handle = activeSessionHandle {
session = try await liveModel.connect(
sessionResumption: SessionResumptionConfig(handle: handle)
)
}
// Option 2: Resume the session directly on an existing session object
if let handle = activeSessionHandle {
try await session.resumeSession(
sessionResumption: SessionResumptionConfig(handle: handle)
)
}
Kotlin
// Local variable to save the active session handle
var activeSessionHandle: String? = null
// Initialize the session. Passing an empty config requests the server to send SessionResumptionUpdate
var session = liveModel.connect(
sessionResumption = SessionResumptionConfig()
)
// Start receiving responses
session.receive().collect { message ->
// Process other received response types...
// Check for new session handles inside your message handling loop
if (message is LiveSessionResumptionUpdate) {
if (message.resumable == true && message.newHandle != null) {
activeSessionHandle = message.newHandle
Log.d("TAG", "SessionResumptionUpdate: handle ${message.newHandle}")
}
}
}
// The following are alternative options to resume a session. Choose only one.
// Option 1: Create and connect a session to resume with the saved handle
activeSessionHandle?.let { handle ->
session = liveModel.connect(
sessionResumption = SessionResumptionConfig(handle = handle)
)
}
// Option 2: Resume the session directly on an existing session object
activeSessionHandle?.let { handle ->
session.resumeSession(
sessionResumption = SessionResumptionConfig(handle = handle)
)
}
Java
For Java, session resumption is not yet supported. Check back soon!
Web
// Local variable to save the active session handle
let activeSessionHandle = null;
// Initialize the session. Passing an empty object requests the server to send SessionResumptionUpdate
let session = await liveModel.connect({});
// Start receiving responses
for await (const message of session.receive()) {
// Process other received response types...
// Check for new session handles inside your message handling loop
if (message.type === 'sessionResumptionUpdate') {
if (message.resumable && message.newHandle) {
activeSessionHandle = message.newHandle;
console.log(`SessionResumptionUpdate: handle ${activeSessionHandle}`);
}
}
}
// The following are alternative options to resume a session. Choose only one.
// Option 1: Create and connect a session to resume with the saved handle
if (activeSessionHandle) {
session = await liveModel.connect({
handle: activeSessionHandle
});
}
// Option 2: Resume the session directly on an existing session object
if (activeSessionHandle) {
await session.resumeSession({
handle: activeSessionHandle
});
}
Dart
// Local variable to save the active session handle
String? _activeSessionHandle;
// Initialize the session. Passing an empty config requests the server to send SessionResumptionUpdate
var _session = await _liveModel.connect(
sessionResumption: SessionResumptionConfig(),
);
// Start receiving responses
await for (final message in _session.receive()) {
// Process other received response types...
// Check for new session handles inside your message handling loop
if (message is SessionResumptionUpdate &&
message.resumable != null &&
message.resumable!) {
_activeSessionHandle = message.newHandle;
log('SessionResumptionUpdate: handle ${message.newHandle}');
}
}
// The following are alternative options to resume a session. Choose only one.
// Option 1: Create and connect a session to resume with the saved handle
if (_activeSessionHandle != null) {
_session = await _liveModel.connect(
sessionResumption: SessionResumptionConfig.resume(_activeSessionHandle!),
);
}
// Option 2: Alternatively, resume the session directly on an existing session object
if (_activeSessionHandle != null) {
await _session.resumeSession(
sessionResumption: SessionResumptionConfig.resume(_activeSessionHandle!),
);
}
Unity
// Local variable to save the active session handle
string activeSessionHandle = null;
// Initialize the session. Passing an empty config requests the server to send SessionResumptionUpdate
var session = await liveModel.ConnectAsync(
sessionResumption: new SessionResumptionConfig()
);
// Start receiving responses
await foreach (var response in session.ReceiveAsync())
{
// Process other received response types...
// Check for new session handles inside your message handling loop
if (response.Message is LiveSessionResumptionUpdate updateMessage)
{
if (updateMessage.Resumable == true && !string.IsNullOrEmpty(updateMessage.NewHandle))
{
activeSessionHandle = updateMessage.NewHandle;
Debug.Log($"SessionResumptionUpdate: handle {activeSessionHandle}");
}
}
}
// The following are alternative options to resume a session. Choose only one.
// Option 1: Create and connect a session to resume with the saved handle
if (!string.IsNullOrEmpty(activeSessionHandle)) {
session = await liveModel.ConnectAsync(
sessionResumption: new SessionResumptionConfig(activeSessionHandle)
);
}
// Option 2: Resume the session directly on an existing session object
if (!string.IsNullOrEmpty(activeSessionHandle)) {
await session.ResumeSessionAsync(
sessionResumption: new SessionResumptionConfig(activeSessionHandle)
);
}