Firebase is back at Cloud Next on April 9 - 11. Register now.

Diese Seite wurde von der Cloud Translation API übersetzt.

Unterstützte Modelle

Mit den Vertex AI in Firebase SDKs können Sie bei mobilen und Web-Apps direkt über Ihre App mit den unterstützten Gemini-Modellen interagieren.

Gemini-Modelle gelten als multimodal, da sie mehrere Modalitäten verarbeiten und sogar generieren können, darunter Text, Code, PDFs, Bilder, Video und Audio.

Hier finden Sie einen kurzen Überblick über die unterstützten Modelle für Vertex AI in Firebase und ihre neuesten stabilen Versionen. In den folgenden Abschnitten auf dieser Seite finden Sie detailliertere Vergleiche und Informationen.

Modell	Eingabe	Ausgabe	Optimiert für
Gemini-Modelle
Gemini 2.0 Flash `gemini-2.0-flash-001`	Text, Code, PDFs, Bilder, Video, Audio	Text, Code, JSON (Bilder und Audio bald verfügbar)	Funktionen der nächsten Generation, Geschwindigkeit und multimodale Generierung für eine Vielzahl von Aufgaben
Gemini 1.5 Pro `gemini-1.5-pro-002`	Text, Code, PDFs, Bilder, Video, Audio	Text, Code, JSON	Komplexe Denkaufgaben, die mehr Intelligenz erfordern
Gemini 1.5 Flash `gemini-1.5-flash-002`	Text, Code, PDFs, Bilder, Video, Audio	Text, Code, JSON	Schnelle und vielseitige Leistung für eine Vielzahl von Aufgaben

Unterstützt Vertex AI in Firebase ältere Modelle wie Gemini 1.0?

Ja, Vertex AI in Firebase unterstützt alle Gemini-Modelle, auch ältere.

Modell	Eingabe	Ausgabe	Optimiert für
Gemini 1.0 Pro Vision `gemini-1.0-pro-vision-001`	Text, Code, PDFs, Bilder, Video (nur Frames)	text, code	Verarbeitet Text, Bilder und Video für Text- oder Codeantworten. Kann nicht für Chats verwendet werden.
Gemini 1.0 Pro `gemini-1.0-pro-002`	text, code	text, code	Aufgaben in natürlicher Sprache, Text- und Code-Chats in mehreren Schritten und Codegenerierung

Unten auf dieser Seite finden Sie detaillierte Informationen zu älteren Modellen. In unseren häufig gestellten Fragen finden Sie Informationen zu allen Modellen, die von Vertex AI in Firebase unterstützt werden und von denen dies nicht der Fall ist.

Im Rest dieser Seite finden Sie detaillierte Informationen zu den von Vertex AI in Firebase unterstützten Modellen:

Modelle vergleichen:
- Unterstützte Eingabe und Ausgabe
- Grober Vergleich der unterstützten Funktionen
- Spezifikationen und Einschränkungen, z. B. maximale Eingabetokens oder maximale Länge des Eingabevideos
Beschreibung der Versionierung von Modellen, insbesondere der stabilen, automatisch aktualisierten und Vorabversionen
Listen mit verfügbaren Modellnamen, die bei der Initialisierung in Ihren Code aufgenommen werden sollen
Listen der unterstützten Sprachen für die Modelle

Unten auf dieser Seite finden Sie detaillierte Informationen zu älteren Modellen.

Modelle vergleichen

Jedes Modell hat unterschiedliche Funktionen, die für verschiedene Anwendungsfälle geeignet sind. In den Tabellen in diesem Abschnitt wird jedes Modell bei Verwendung mit Vertex AI in Firebase beschrieben. Jedes Modell kann zusätzliche Funktionen haben, die bei der Verwendung unserer SDKs nicht verfügbar sind.

Weitere Informationen zu den einzelnen Gemini-Modellen finden Sie in der Google Cloud-Dokumentation.

Unterstützte Eingabe und Ausgabe

Die folgenden Eingabe- und Ausgabetypen werden unterstützt, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:

	Gemini 2.0 Flash	Gemini 1.5 Pro	Gemini 1.5 Flash
Eingabetypen
Text
Code
Dokumente (PDFs oder reiner Text)
Bilder, Video und Audio
Audio (Streaming)	Demnächst verfügbar
Ausgabetypen
Text
Strukturierte Ausgabe (z. B. JSON)
Code
Bilder	Demnächst verfügbar
Audio	Demnächst verfügbar
Audio (Streaming)	Demnächst verfügbar

Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Eingabedateien und Anforderungen für die Vertex AI Gemini API.

Unterstützte Funktionen

Die folgenden Funktionen werden unterstützt, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:

		Gemini 2.0 Flash
Text aus Text- oder multimodalen Eingaben generieren
Bilder erstellen		Demnächst verfügbar
Audio generieren		Demnächst verfügbar
Strukturierte Ausgabe generieren (z. B. JSON)
Bilder und Videos analysieren (Vision)
Audio analysieren
Dokumente (PDFs oder reinen Text) analysieren
Wechselseitiger Chat
Funktionsaufrufe (Tools)
	Grundlegende Funktionsaufrufe
	Paralleler Funktionsaufruf
	Modus für Funktionsaufrufe
Tokens und abrechenbare Zeichen zählen
Systemanweisungen
Multimodal Live API (bidirektionales Streaming)		Demnächst verfügbar

Spezifikationen und Einschränkungen

Die folgenden Spezifikationen und Einschränkungen gelten für die Verwendung der einzelnen Modelle mit Vertex AI in Firebase:

Attribut	Gemini 2.0 Flash	Gemini 1.5 Pro	Gemini 1.5 Flash
Kontextfenster * Gesamttokenlimit (Eingabe + Ausgabe)	1.048.576 Tokens	2.097.152 Tokens	1.048.576 Tokens
Ausgabetokenlimit *	8.192 Tokens	8.192 Tokens	8.192 Tokens
Datum des Kenntnisstands	Juni 2024	Mai 2024	Mai 2024
Bilder (pro Anfrage)
Maximale Anzahl von Eingabebildern	3.000 Bilder	3.000 Bilder	3.000 Bilder
Maximale Anzahl von Ausgabebildern	Demnächst verfügbar	---	---
Maximale Größe pro Eingabe eines base64-codierten Bildes	7 MB	7 MB	7 MB
PDFs (auf Anfrage)
Maximale Anzahl der Eingabe-PDF-Dateien **	3.000 Dateien	3.000 Dateien	3.000 Dateien
Maximale Seitenzahl pro Eingabe-PDF-Datei **	1.000 Seiten	1.000 Seiten	1.000 Seiten
Maximale Größe pro Eingabe-PDF-Datei	50 MB	50 MB	50 MB
Video (auf Anfrage)
Maximale Anzahl von Eingabevideodateien	10 Dateien	10 Dateien	10 Dateien
Maximale Länge des gesamten Eingabevideos (nur Frames)	~ 60 Minuten	~ 60 Minuten	~ 60 Minuten
Maximale Länge des gesamten Eingabevideos (Frames + Audio)	ca. 45 Minuten	ca. 45 Minuten	ca. 45 Minuten
Audio (auf Anfrage)
Maximale Anzahl von Eingabe-Audiodateien	1 Datei	1 Datei	1 Datei
Maximale Anzahl von Ausgabe-Audiodateien	Demnächst verfügbar	---	---
Maximale Länge aller Eingabe-Audioinhalte	~ 8,4 Stunden	~ 8,4 Stunden	~ 8,4 Stunden
Maximale Länge aller Audioausgaben	Demnächst verfügbar	---	---

^{* Bei allen Modellen entspricht ein Token etwa 4 Zeichen. 100 Tokens entsprechen also etwa 60–80 englischen Wörtern. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens ermitteln.}

^{** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein einzelnes Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.}

Weitere Informationen

Kontingente und Preise sind für jedes Modell unterschiedlich. Die Preise hängen auch von Eingabe und Ausgabe ab.
Weitere Informationen zu unterstützten Eingabedateitypen, zum Angeben des MIME-Typs und dazu, wie Sie dafür sorgen, dass Ihre Eingabedateien und multimodalen Anfragen die Anforderungen erfüllen und Best Practices einhalten, finden Sie unter Unterstützte Eingabedateien und Anforderungen für die Vertex AI Gemini API.

Versionierung und Benennung von Modellen

Die Modelle sind in stabilen, automatisch aktualisierten und Vorabversionen verfügbar.

Stabile Versionen gelten als allgemein verfügbar.
- Stabile Versionen haben Modellnamen, an die eine bestimmte dreistellige Versionsnummer angehängt ist, z. B. gemini-2.0-flash-001.
Automatisch aktualisierte Versionen verweisen immer auf die aktuelle stabile Version dieses Modells. Wenn eine neue stabile Version veröffentlicht wird, verweist die automatisch aktualisierte Version automatisch auf diese neue stabile Version.
- Automatisch aktualisierte Versionen haben Modellnamen ohne Zusatz, z. B. gemini-2.0-flash.
Vorabversionen bieten neue Funktionen und gelten als nicht stabil. Vorschauversionen verweisen immer auf die aktuelle Vorschauversion dieses Modells. Wenn eine neue Vorschauversion veröffentlicht wird, verweist jede vorhandene Vorschauversion automatisch auf diese neue Vorschauversion.
- Modellnamen von Vorabversionen werden mit -preview und dem Datum der Erstveröffentlichung des Modells (-MMDD) angehängt, z. B. gemini-1.5-pro-preview-0409 (veröffentlicht am 9. April 2024).

Weitere Informationen zu den verfügbaren Modellversionen und ihrem Lebenszyklus (Gemini) finden Sie in der Google Cloud-Dokumentation.

Verfügbare Modellnamen

Modellnamen sind die expliziten Werte, die Sie in Ihren Code während der Initialisierung des generativen Modells einfügen. Dies ist ein erforderlicher Schritt, um die Gemini API aufzurufen.

Mit dem publishers.models.list-Endpunkt können Sie alle verfügbaren Modellnamen auflisten. Hinweis: Diese Liste enthält alle Modelle, die von Vertex AI unterstützt werden. Vertex AI in Firebase unterstützt jedoch nur die auf dieser Seite beschriebenen Gemini-Modelle. Automatisch aktualisierte Versionen (z. B. gemini-2.0-flash) sind nicht aufgeführt, da sie nur ein Alias für das stabile Basismodell sind.

Gemini-Modellnamen

Beispiele für die Initialisierung in Ihrer Sprache finden Sie im Einstiegsleitfaden.

Gemini 2.0 Flash-Modellnamen

Modellname	Beschreibung	Release-Phase	Datum der Erstveröffentlichung	Einstellungsdatum
Stabile Versionen
`gemini-2.0-flash-001`	Neueste stabile Version von Gemini 2.0 Flash	General Availability	2025-02-05	Noch nicht bekannt
Automatisch aktualisierte Version
`gemini-2.0-flash`	Verweist auf die aktuelle stabile Version von 2.0 Flash (derzeit `gemini-2.0-flash-001`)	General Availability	2025-02-10	---

Modellnamen von Gemini 1.5 Pro

Modellname	Beschreibung	Release-Phase	Datum der Erstveröffentlichung	Einstellungsdatum
Stabile Versionen
`gemini-1.5-pro-002`	Neueste stabile Version von Gemini 1.5 Pro	General Availability	2024-09-24	Frühestens am 24.09.2025
`gemini-1.5-pro-001`	Erste stabile Version von Gemini 1.5 Pro	General Availability	2024-05-24	Frühestens am 24. Mai 2025
Automatisch aktualisierte Version
`gemini-1.5-pro`	Verweist auf die aktuelle stabile Version von 1.5 Pro (derzeit `gemini-1.5-pro-002`)	General Availability	2024-09-24	---

Gemini 1.5 Flash-Modellnamen

Modellname	Beschreibung	Release-Phase	Datum der Erstveröffentlichung	Einstellungsdatum
Stabile Versionen
`gemini-1.5-flash-002`	Neueste stabile Version von Gemini 1.5 Flash	General Availability	2024-09-24	Frühestens am 24.09.2025
`gemini-1.5-flash-001`	Erste stabile Version von Gemini 1.5 Flash	General Availability	2024-05-24	Frühestens am 24. Mai 2025
Automatisch aktualisierte Version
`gemini-1.5-flash`	Verweist auf die neueste stabile Version von 1.5 Flash (aktuell `gemini-1.5-flash-002`)	General Availability	2024-09-24	---

Unterstützte Sprachen

Gemini

Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

Arabisch (ar), Bengalisch (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Deutsch (de), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no) ), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi).
Die Modelle Gemini 1.5 Pro und Gemini 1.5 Flash können in den folgenden zusätzlichen Sprachen verstehen und antworten:

Afrikaans (af), Amharisch (am), Assamesisch (as), Aserbaidschanisch (az), Weißrussisch (be), Bosnisch (bs), Katalanisch (ca), Cebuano (ceb), Korsisch (co), Walisisch (cy), Divehi (dv), Esperanto (eo), Baskisch (eu), Persisch (fa), Filipino (Tagalog) (fil), Friesisch (fy), Irisch (ga), Schottisch-Gälisch (gd), Galicisch (gl), Gujarati (gu), Hausa (ha), Hawaiianisch (haw), Hmong (hmn), Haitianisch-Kreolisch (ht), Armenisch (hy), Igbo (ig), Isländisch (is), Javanisch (jv), Georgisch (ka), Kasachisch (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Lateinisch (la), Luxemburgisch (lb), Laotisch (lo), Malagasy (mg), Maori (mi), Mazedonisch (mk), Malayalam (ml), Mongolisch (mn), Meitei (Manipuri) (mni-Mtei), Marathi (mr), Malaysisch (ms), Maltesisch (mt), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Paschtu (ps), Sindhi (sd), Sinhala (Singhalesisch) (si), Samoanisch (sm), Shona (sn), Somali (so), Albanisch (sq), Sesotho (st), Sundanesisch (su), Tamil (ta), Telugu (te), Tadschikisch (tg), Uigurisch (ug), Urdu (ur), Usbekisch (uz), Xhosa (xh), Jiddisch (yi), Yoruba (yo), Zulu (zu)

Informationen zu älteren Modellen

Vertex AI in Firebase unterstützt alle Gemini-Modelle, einschließlich älterer Modelle wie Gemini 1.0 Pro und Gemini 1.0 Pro Vision. Wir empfehlen jedoch dringend, ein neueres Modell mit unseren SDKs zu verwenden. Diese älteren Gemini-Modelle werden bald eingestellt und bieten nicht alle Funktionen der neueren Modelle.

Unterstützte Eingabe- und Ausgabe von älteren Modellen ansehen

Das sind die Eingabe- und Ausgabetypen, die bei Verwendung der einzelnen Modelle mit Vertex AI in Firebase verwendet werden:

	Gemini 1.0 Pro Vision	Gemini 1.0 Pro
Eingabetypen
Text
Code
Bild
Dokumente (PDFs oder Nur-Text)
Video (nur Frames)
Video (Frames + Audio)
Audio
Ausgabetypen
Text
Code
Bilder, Video und Audio

Unterstützte Funktionen älterer Modelle

Die folgenden Funktionen sind verfügbar, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:

		Gemini 1.0 Pro Vision	Gemini 1.0 Pro
Text aus nur Text-Eingabe generieren
Text aus multimodaler Eingabe generieren
Bilder, Videos oder Audioinhalte generieren
Strukturierte Ausgabe (z. B. JSON) mithilfe des Antwortschemas generieren
Wechselseitiger Chat
Funktionsaufrufe (Tools)
	Grundlegende Funktionsaufrufe
	Paralleler Funktionsaufruf
	Modus für Funktionsaufrufe
Tokens und abrechenbare Zeichen zählen
Systemanweisungen

Spezifikationen und Einschränkungen älterer Modelle

Die folgenden Spezifikationen und Einschränkungen gelten für die Verwendung der einzelnen Modelle mit Vertex AI in Firebase:

Attribut	Gemini 1.0 Pro Vision	Gemini 1.0 Pro
Kontextfenster * Gesamttokenlimit (Eingabe + Ausgabe)	16.384 Tokens	32.760 Tokens
Ausgabetokenlimit *	2.048 Tokens	8.192 Tokens
Datum des Kenntnisstands	Februar 2023	Februar 2023
Bilder (pro Anfrage)
Maximale Anzahl von Eingabebildern	16 Bilder	---
Maximale Größe pro base64-codiertem Eingabebild	7 MB	---
PDFs (auf Anfrage)
Maximale Anzahl der Eingabe-PDF-Dateien **	16 Dateien	---
Maximale Seitenzahl pro Eingabe-PDF-Datei **	16 Seiten	---
Maximale Größe pro Eingabe-PDF-Datei	50 MB	---
Video (auf Anfrage)
Maximale Anzahl von Eingabevideodateien	1 Datei	---
Maximale Länge des gesamten Eingabevideos (nur Frames)	2 Minuten	---
Maximale Länge des gesamten Eingabevideos (Frames + Audio)	---	---
Audio (auf Anfrage)
Maximale Anzahl von Eingabe-Audiodateien	---	---
Maximale Länge aller Eingabeaudioinhalte	---	---

Verfügbare Modellnamen älterer Modelle

Gemini 1.0 Pro Vision-Modellnamen

Modellname	Beschreibung	Release-Phase	Datum der Erstveröffentlichung	Einstellungsdatum
Stabile Versionen
`gemini-1.0-pro-vision-001`	Neueste stabile Version von Gemini 1.0 Pro Vision	General Availability	2024-02-15	Frühestens am 15.02.2025
Automatisch aktualisierte Version
`gemini-1.0-pro-vision`	Verweist auf die aktuelle stabile Version von 1.5 Pro Vision (derzeit `gemini-1.5-pro-vision-001`)	General Availability	2024-01-04	---

Gemini 1.0 Pro-Modellnamen

Modellname	Beschreibung	Release-Phase	Datum der Erstveröffentlichung	Einstellungsdatum
Stabile Versionen
`gemini-1.0-pro-002`	Neueste stabile Version von Gemini 1.0 Pro	General Availability	2024-04-09	Frühestens am 09.04.2025
`gemini-1.0-pro-001`	Stabile Version von Gemini 1.0 Pro	General Availability	2024-02-15	Frühestens am 15.02.2025
Automatisch aktualisierte Version
`gemini-1.0-pro`	Verweist auf die aktuelle stabile Version von 1.0 Pro (derzeit `gemini-1.0-pro-002`)	General Availability	2024-02-15	---

Weiteres Vorgehen

Funktionen des Gemini API testen

Unterhaltungen in mehreren Runden (Chat) erstellen
Text aus nur-Text-Prompts generieren
Text aus multimodalen Prompts generieren (einschließlich Text, Bildern, PDFs, Videos und Audio).
Sie können sowohl aus Text- als auch aus multimodalen Prompts strukturierte Ausgabe (z. B. JSON) generieren.
Verwenden Sie Funktionsaufrufe, um generative Modelle mit externen Systemen und Informationen zu verbinden.