The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models will shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Videodateien mit der Gemini API analysieren

Sie können ein Gemini Modell bitten, Videodateien zu analysieren, die Sie entweder inline (base64-codiert) oder per URL bereitstellen. Wenn Sie Firebase AI Logic, verwenden, können Sie diese Anfrage direkt aus Ihrer App stellen.

Mit dieser Funktion können Sie beispielsweise Folgendes tun:

Videos mit Untertiteln versehen und Fragen zu Videos beantworten
Bestimmte Segmente eines Videos mithilfe von Zeitstempeln analysieren
Videoinhalte transkribieren, indem Sie sowohl die Audiospur als auch die visuellen Frames verarbeiten
Videos beschreiben, segmentieren und Informationen daraus extrahieren, einschließlich der Audiospur und der visuellen Frames

Zu den Codebeispielen springen Zum Code für gestreamte Antworten springen

Weitere Anleitungen mit zusätzlichen Optionen für die Arbeit mit Videos
Strukturierte Ausgabe generieren Wechselseitiger Chat

Hinweis

Klicken Sie auf Ihren Gemini API Anbieter, um anbieterspezifische Inhalte und Code auf dieser Seite aufzurufen.

Wenn Sie es noch nicht getan haben, folgen Sie der Anleitung für den Einstieg. Dort wird beschrieben, wie Sie Ihr Firebase-Projekt einrichten, Ihre App mit Firebase verbinden, das SDK hinzufügen, den Back-End-Dienst für den ausgewählten Gemini API initialisieren und eine GenerativeModel Instanz erstellen.

Zum Testen und Iterieren Ihrer Prompts empfehlen wir Google AI Studio.

Benötigen Sie eine Beispielvideodatei?

Sie können diese öffentlich verfügbare Datei mit dem MIME-Typ video/mp4 (Datei ansehen oder herunterladen). https://storage.googleapis.com/cloud-samples-data/video/animals.mp4

Text aus Videodateien generieren (base64-codiert)

Bevor Sie dieses Beispiel ausprobieren, führen Sie die Schritte im Abschnitt Hinweis dieser Anleitung aus, um Ihr Projekt und Ihre App einzurichten.
In diesem Abschnitt klicken Sie auch auf eine Schaltfläche für den ausgewählten Gemini API Anbieter, damit auf dieser Seite anbieterspezifische Inhalte angezeigt werden.

Sie können ein Gemini Modell bitten, Text zu generieren, indem Sie Text und Video als Prompt verwenden. Geben Sie dazu den `mimeType` jeder Eingabedatei mimeType und die Datei selbst an. Anforderungen und Empfehlungen für Eingabedateien finden Sie weiter unten auf dieser Seite.

In diesem Beispiel wird die Datei inline bereitgestellt. Die SDKs unterstützen aber auch die Bereitstellung einer YouTube-URL.