Unterstützte Modelle

Mit den Vertex AI in Firebase SDKs können Sie bei mobilen und Web-Apps direkt über Ihre App mit den unterstützten Gemini-Modellen interagieren.

Gemini-Modelle gelten als multimodal, da sie mehrere Modalitäten verarbeiten und sogar generieren können, darunter Text, Code, PDFs, Bilder, Video und Audio.

Hier finden Sie einen kurzen Überblick über die unterstützten Modelle für Vertex AI in Firebase und ihre neuesten stabilen Versionen. In den folgenden Abschnitten auf dieser Seite finden Sie detailliertere Vergleiche und Informationen.

Modell Eingabe Ausgabe Optimiert für
Gemini-Modelle
Gemini 2.0 Flash
gemini-2.0-flash-001
Text, Code, PDFs, Bilder, Video, Audio Text, Code, JSON
(Bilder und Audio bald verfügbar)
Funktionen der nächsten Generation, Geschwindigkeit und multimodale Generierung für eine Vielzahl von Aufgaben
Gemini 1.5 Pro
gemini-1.5-pro-002
Text, Code, PDFs, Bilder, Video, Audio Text, Code, JSON Komplexe Denkaufgaben, die mehr Intelligenz erfordern
Gemini 1.5 Flash
gemini-1.5-flash-002
Text, Code, PDFs, Bilder, Video, Audio Text, Code, JSON Schnelle und vielseitige Leistung für eine Vielzahl von Aufgaben


Im Rest dieser Seite finden Sie detaillierte Informationen zu den von Vertex AI in Firebase unterstützten Modellen:

  • Modelle vergleichen:

    • Unterstützte Eingabe und Ausgabe
    • Grober Vergleich der unterstützten Funktionen
    • Spezifikationen und Einschränkungen, z. B. maximale Eingabetokens oder maximale Länge des Eingabevideos
  • Beschreibung der Versionierung von Modellen, insbesondere der stabilen, automatisch aktualisierten und Vorabversionen

  • Listen mit verfügbaren Modellnamen, die bei der Initialisierung in Ihren Code aufgenommen werden sollen

  • Listen der unterstützten Sprachen für die Modelle

Unten auf dieser Seite finden Sie detaillierte Informationen zu älteren Modellen.



Modelle vergleichen

Jedes Modell hat unterschiedliche Funktionen, die für verschiedene Anwendungsfälle geeignet sind. In den Tabellen in diesem Abschnitt wird jedes Modell bei Verwendung mit Vertex AI in Firebase beschrieben. Jedes Modell kann zusätzliche Funktionen haben, die bei der Verwendung unserer SDKs nicht verfügbar sind.

Weitere Informationen zu den einzelnen Gemini-Modellen finden Sie in der Google Cloud-Dokumentation.

Unterstützte Eingabe und Ausgabe

Die folgenden Eingabe- und Ausgabetypen werden unterstützt, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Eingabetypen
Text
Code
Dokumente (PDFs oder reiner Text)
Bilder, Video und Audio
Audio (Streaming) Demnächst verfügbar
Ausgabetypen
Text
Strukturierte Ausgabe (z. B. JSON)
Code
Bilder Demnächst verfügbar
Audio Demnächst verfügbar
Audio (Streaming) Demnächst verfügbar

Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Eingabedateien und Anforderungen für die Vertex AI Gemini API.

Unterstützte Funktionen

Die folgenden Funktionen werden unterstützt, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Text aus Text- oder multimodalen Eingaben generieren
Bilder erstellen Demnächst verfügbar
Audio generieren Demnächst verfügbar
Strukturierte Ausgabe generieren (z. B. JSON)
Bilder und Videos analysieren (Vision)
Audio analysieren
Dokumente (PDFs oder reinen Text) analysieren
Wechselseitiger Chat
Funktionsaufrufe (Tools)
Grundlegende Funktionsaufrufe
Paralleler Funktionsaufruf
Modus für Funktionsaufrufe
Tokens und abrechenbare Zeichen zählen
Systemanweisungen
Multimodal Live API (bidirektionales Streaming) Demnächst verfügbar

Spezifikationen und Einschränkungen

Die folgenden Spezifikationen und Einschränkungen gelten für die Verwendung der einzelnen Modelle mit Vertex AI in Firebase:

Attribut Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Kontextfenster *
Gesamttokenlimit (Eingabe + Ausgabe)
1.048.576 Tokens 2.097.152 Tokens 1.048.576 Tokens
Ausgabetokenlimit * 8.192 Tokens 8.192 Tokens 8.192 Tokens
Datum des Kenntnisstands Juni 2024 Mai 2024 Mai 2024
Bilder (pro Anfrage)
Maximale Anzahl von Eingabebildern 3.000 Bilder 3.000 Bilder 3.000 Bilder
Maximale Anzahl von Ausgabebildern Demnächst verfügbar --- ---
Maximale Größe pro Eingabe eines base64-codierten Bildes 7 MB 7 MB 7 MB
PDFs (auf Anfrage)
Maximale Anzahl der Eingabe-PDF-Dateien ** 3.000 Dateien 3.000 Dateien 3.000 Dateien
Maximale Seitenzahl pro Eingabe-PDF-Datei ** 1.000 Seiten 1.000 Seiten 1.000 Seiten
Maximale Größe pro Eingabe-PDF-Datei 50 MB 50 MB 50 MB
Video (auf Anfrage)
Maximale Anzahl von Eingabevideodateien 10 Dateien 10 Dateien 10 Dateien
Maximale Länge des gesamten Eingabevideos (nur Frames) ~ 60 Minuten ~ 60 Minuten ~ 60 Minuten
Maximale Länge des gesamten Eingabevideos (Frames + Audio) ca. 45 Minuten ca. 45 Minuten ca. 45 Minuten
Audio (auf Anfrage)
Maximale Anzahl von Eingabe-Audiodateien 1 Datei 1 Datei 1 Datei
Maximale Anzahl von Ausgabe-Audiodateien Demnächst verfügbar --- ---
Maximale Länge aller Eingabe-Audioinhalte ~ 8,4 Stunden ~ 8,4 Stunden ~ 8,4 Stunden
Maximale Länge aller Audioausgaben Demnächst verfügbar --- ---

* Bei allen Modellen entspricht ein Token etwa 4 Zeichen. 100 Tokens entsprechen also etwa 60–80 englischen Wörtern. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens ermitteln.

** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein einzelnes Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.

Weitere Informationen



Versionierung und Benennung von Modellen

Die Modelle sind in stabilen, automatisch aktualisierten und Vorabversionen verfügbar.

  • Stabile Versionen gelten als allgemein verfügbar.

    • Stabile Versionen haben Modellnamen, an die eine bestimmte dreistellige Versionsnummer angehängt ist, z. B. gemini-2.0-flash-001.
  • Automatisch aktualisierte Versionen verweisen immer auf die aktuelle stabile Version dieses Modells. Wenn eine neue stabile Version veröffentlicht wird, verweist die automatisch aktualisierte Version automatisch auf diese neue stabile Version.

    • Automatisch aktualisierte Versionen haben Modellnamen ohne Zusatz, z. B. gemini-2.0-flash.
  • Vorabversionen bieten neue Funktionen und gelten als nicht stabil. Vorschauversionen verweisen immer auf die aktuelle Vorschauversion dieses Modells. Wenn eine neue Vorschauversion veröffentlicht wird, verweist jede vorhandene Vorschauversion automatisch auf diese neue Vorschauversion.

    • Modellnamen von Vorabversionen werden mit -preview und dem Datum der Erstveröffentlichung des Modells (-MMDD) angehängt, z. B. gemini-1.5-pro-preview-0409 (veröffentlicht am 9. April 2024).

Weitere Informationen zu den verfügbaren Modellversionen und ihrem Lebenszyklus (Gemini) finden Sie in der Google Cloud-Dokumentation.



Verfügbare Modellnamen

Modellnamen sind die expliziten Werte, die Sie in Ihren Code während der Initialisierung des generativen Modells einfügen. Dies ist ein erforderlicher Schritt, um die Gemini API aufzurufen.

Mit dem publishers.models.list-Endpunkt können Sie alle verfügbaren Modellnamen auflisten. Hinweis: Diese Liste enthält alle Modelle, die von Vertex AI unterstützt werden. Vertex AI in Firebase unterstützt jedoch nur die auf dieser Seite beschriebenen Gemini-Modelle. Automatisch aktualisierte Versionen (z. B. gemini-2.0-flash) sind nicht aufgeführt, da sie nur ein Alias für das stabile Basismodell sind.

Gemini-Modellnamen

Beispiele für die Initialisierung in Ihrer Sprache finden Sie im Einstiegsleitfaden.

Gemini 2.0 Flash-Modellnamen

Modellname Beschreibung Release-Phase Datum der Erstveröffentlichung Einstellungsdatum
Stabile Versionen
gemini-2.0-flash-001 Neueste stabile Version von Gemini 2.0 Flash General Availability 2025-02-05 Noch nicht bekannt
Automatisch aktualisierte Version
gemini-2.0-flash Verweist auf die aktuelle stabile Version von 2.0 Flash
(derzeit gemini-2.0-flash-001)
General Availability 2025-02-10 ---

Modellnamen von Gemini 1.5 Pro

Modellname Beschreibung Release-Phase Datum der Erstveröffentlichung Einstellungsdatum
Stabile Versionen
gemini-1.5-pro-002 Neueste stabile Version von Gemini 1.5 Pro General Availability 2024-09-24 Frühestens am 24.09.2025
gemini-1.5-pro-001 Erste stabile Version von Gemini 1.5 Pro General Availability 2024-05-24 Frühestens am 24. Mai 2025
Automatisch aktualisierte Version
gemini-1.5-pro Verweist auf die aktuelle stabile Version von 1.5 Pro
(derzeit gemini-1.5-pro-002)
General Availability 2024-09-24 ---

Gemini 1.5 Flash-Modellnamen

Modellname Beschreibung Release-Phase Datum der Erstveröffentlichung Einstellungsdatum
Stabile Versionen
gemini-1.5-flash-002 Neueste stabile Version von Gemini 1.5 Flash General Availability 2024-09-24 Frühestens am 24.09.2025
gemini-1.5-flash-001 Erste stabile Version von Gemini 1.5 Flash General Availability 2024-05-24 Frühestens am 24. Mai 2025
Automatisch aktualisierte Version
gemini-1.5-flash Verweist auf die neueste stabile Version von 1.5 Flash
(aktuell gemini-1.5-flash-002)
General Availability 2024-09-24 ---



Unterstützte Sprachen

Gemini

  • Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:

    Arabisch (ar), Bengalisch (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Deutsch (de), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no) ), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi).

  • Die Modelle Gemini 1.5 Pro und Gemini 1.5 Flash können in den folgenden zusätzlichen Sprachen verstehen und antworten:

    Afrikaans (af), Amharisch (am), Assamesisch (as), Aserbaidschanisch (az), Weißrussisch (be), Bosnisch (bs), Katalanisch (ca), Cebuano (ceb), Korsisch (co), Walisisch (cy), Divehi (dv), Esperanto (eo), Baskisch (eu), Persisch (fa), Filipino (Tagalog) (fil), Friesisch (fy), Irisch (ga), Schottisch-Gälisch (gd), Galicisch (gl), Gujarati (gu), Hausa (ha), Hawaiianisch (haw), Hmong (hmn), Haitianisch-Kreolisch (ht), Armenisch (hy), Igbo (ig), Isländisch (is), Javanisch (jv), Georgisch (ka), Kasachisch (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Lateinisch (la), Luxemburgisch (lb), Laotisch (lo), Malagasy (mg), Maori (mi), Mazedonisch (mk), Malayalam (ml), Mongolisch (mn), Meitei (Manipuri) (mni-Mtei), Marathi (mr), Malaysisch (ms), Maltesisch (mt), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Paschtu (ps), Sindhi (sd), Sinhala (Singhalesisch) (si), Samoanisch (sm), Shona (sn), Somali (so), Albanisch (sq), Sesotho (st), Sundanesisch (su), Tamil (ta), Telugu (te), Tadschikisch (tg), Uigurisch (ug), Urdu (ur), Usbekisch (uz), Xhosa (xh), Jiddisch (yi), Yoruba (yo), Zulu (zu)



Informationen zu älteren Modellen

Vertex AI in Firebase unterstützt alle Gemini-Modelle, einschließlich älterer Modelle wie Gemini 1.0 Pro und Gemini 1.0 Pro Vision. Wir empfehlen jedoch dringend, ein neueres Modell mit unseren SDKs zu verwenden. Diese älteren Gemini-Modelle werden bald eingestellt und bieten nicht alle Funktionen der neueren Modelle.



Weiteres Vorgehen

Funktionen des Gemini API testen