Mit den Vertex AI in Firebase SDKs können Sie bei mobilen und Web-Apps direkt über Ihre App mit den unterstützten Gemini-Modellen interagieren.
Gemini-Modelle gelten als multimodal, da sie mehrere Modalitäten verarbeiten und sogar generieren können, darunter Text, Code, PDFs, Bilder, Video und Audio.
Hier finden Sie einen kurzen Überblick über die unterstützten Modelle für Vertex AI in Firebase und ihre neuesten stabilen Versionen. In den folgenden Abschnitten auf dieser Seite finden Sie detailliertere Vergleiche und Informationen.
Modell | Eingabe | Ausgabe | Optimiert für |
---|---|---|---|
Gemini-Modelle | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON (Bilder und Audio bald verfügbar) |
Funktionen der nächsten Generation, Geschwindigkeit und multimodale Generierung für eine Vielzahl von Aufgaben |
Gemini 1.5 Progemini-1.5-pro-002 |
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON | Komplexe Denkaufgaben, die mehr Intelligenz erfordern |
Gemini 1.5 Flashgemini-1.5-flash-002 |
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON | Schnelle und vielseitige Leistung für eine Vielzahl von Aufgaben |
Im Rest dieser Seite finden Sie detaillierte Informationen zu den von Vertex AI in Firebase unterstützten Modellen:
-
- Unterstützte Eingabe und Ausgabe
- Grober Vergleich der unterstützten Funktionen
- Spezifikationen und Einschränkungen, z. B. maximale Eingabetokens oder maximale Länge des Eingabevideos
Beschreibung der Versionierung von Modellen, insbesondere der stabilen, automatisch aktualisierten und Vorabversionen
Listen mit verfügbaren Modellnamen, die bei der Initialisierung in Ihren Code aufgenommen werden sollen
Listen der unterstützten Sprachen für die Modelle
Unten auf dieser Seite finden Sie detaillierte Informationen zu älteren Modellen.
Modelle vergleichen
Jedes Modell hat unterschiedliche Funktionen, die für verschiedene Anwendungsfälle geeignet sind. In den Tabellen in diesem Abschnitt wird jedes Modell bei Verwendung mit Vertex AI in Firebase beschrieben. Jedes Modell kann zusätzliche Funktionen haben, die bei der Verwendung unserer SDKs nicht verfügbar sind.
Weitere Informationen zu den einzelnen Gemini-Modellen finden Sie in der Google Cloud-Dokumentation.
Unterstützte Eingabe und Ausgabe
Die folgenden Eingabe- und Ausgabetypen werden unterstützt, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
Eingabetypen | ||||
Text | ||||
Code | ||||
Dokumente (PDFs oder reiner Text) | ||||
Bilder, Video und Audio | ||||
Audio (Streaming) | Demnächst verfügbar | |||
Ausgabetypen | ||||
Text | ||||
Strukturierte Ausgabe (z. B. JSON) | ||||
Code | ||||
Bilder | Demnächst verfügbar | |||
Audio | Demnächst verfügbar | |||
Audio (Streaming) | Demnächst verfügbar |
Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Eingabedateien und Anforderungen für die Vertex AI Gemini API.
Unterstützte Funktionen
Die folgenden Funktionen werden unterstützt, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
Text aus Text- oder multimodalen Eingaben generieren | ||||
Bilder erstellen | Demnächst verfügbar | |||
Audio generieren | Demnächst verfügbar | |||
Strukturierte Ausgabe generieren (z. B. JSON) | ||||
Bilder und Videos analysieren (Vision) | ||||
Audio analysieren | ||||
Dokumente (PDFs oder reinen Text) analysieren | ||||
Wechselseitiger Chat | ||||
Funktionsaufrufe (Tools) | ||||
Grundlegende Funktionsaufrufe | ||||
Paralleler Funktionsaufruf | ||||
Modus für Funktionsaufrufe | ||||
Tokens und abrechenbare Zeichen zählen | ||||
Systemanweisungen | ||||
Multimodal Live API (bidirektionales Streaming) | Demnächst verfügbar |
Spezifikationen und Einschränkungen
Die folgenden Spezifikationen und Einschränkungen gelten für die Verwendung der einzelnen Modelle mit Vertex AI in Firebase:
Attribut | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
Kontextfenster * Gesamttokenlimit (Eingabe + Ausgabe) |
1.048.576 Tokens | 2.097.152 Tokens | 1.048.576 Tokens |
Ausgabetokenlimit * | 8.192 Tokens | 8.192 Tokens | 8.192 Tokens |
Datum des Kenntnisstands | Juni 2024 | Mai 2024 | Mai 2024 |
Bilder (pro Anfrage) | |||
Maximale Anzahl von Eingabebildern | 3.000 Bilder | 3.000 Bilder | 3.000 Bilder |
Maximale Anzahl von Ausgabebildern | Demnächst verfügbar | --- | --- |
Maximale Größe pro Eingabe eines base64-codierten Bildes | 7 MB | 7 MB | 7 MB |
PDFs (auf Anfrage) | |||
Maximale Anzahl der Eingabe-PDF-Dateien ** | 3.000 Dateien | 3.000 Dateien | 3.000 Dateien |
Maximale Seitenzahl pro Eingabe-PDF-Datei ** | 1.000 Seiten | 1.000 Seiten | 1.000 Seiten |
Maximale Größe pro Eingabe-PDF-Datei | 50 MB | 50 MB | 50 MB |
Video (auf Anfrage) | |||
Maximale Anzahl von Eingabevideodateien | 10 Dateien | 10 Dateien | 10 Dateien |
Maximale Länge des gesamten Eingabevideos (nur Frames) | ~ 60 Minuten | ~ 60 Minuten | ~ 60 Minuten |
Maximale Länge des gesamten Eingabevideos (Frames + Audio) | ca. 45 Minuten | ca. 45 Minuten | ca. 45 Minuten |
Audio (auf Anfrage) | |||
Maximale Anzahl von Eingabe-Audiodateien | 1 Datei | 1 Datei | 1 Datei |
Maximale Anzahl von Ausgabe-Audiodateien | Demnächst verfügbar | --- | --- |
Maximale Länge aller Eingabe-Audioinhalte | ~ 8,4 Stunden | ~ 8,4 Stunden | ~ 8,4 Stunden |
Maximale Länge aller Audioausgaben | Demnächst verfügbar | --- | --- |
* Bei allen Modellen entspricht ein Token etwa 4 Zeichen. 100 Tokens entsprechen also etwa 60–80 englischen Wörtern. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens
ermitteln.
** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein einzelnes Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.
Weitere Informationen
Kontingente und Preise sind für jedes Modell unterschiedlich. Die Preise hängen auch von Eingabe und Ausgabe ab.
Weitere Informationen zu unterstützten Eingabedateitypen, zum Angeben des MIME-Typs und dazu, wie Sie dafür sorgen, dass Ihre Eingabedateien und multimodalen Anfragen die Anforderungen erfüllen und Best Practices einhalten, finden Sie unter Unterstützte Eingabedateien und Anforderungen für die Vertex AI Gemini API.
Versionierung und Benennung von Modellen
Die Modelle sind in stabilen, automatisch aktualisierten und Vorabversionen verfügbar.
Stabile Versionen gelten als allgemein verfügbar.
- Stabile Versionen haben Modellnamen, an die eine bestimmte dreistellige Versionsnummer angehängt ist, z. B.
.gemini-2.0-flash-001
- Stabile Versionen haben Modellnamen, an die eine bestimmte dreistellige Versionsnummer angehängt ist, z. B.
Automatisch aktualisierte Versionen verweisen immer auf die aktuelle stabile Version dieses Modells. Wenn eine neue stabile Version veröffentlicht wird, verweist die automatisch aktualisierte Version automatisch auf diese neue stabile Version.
- Automatisch aktualisierte Versionen haben Modellnamen ohne Zusatz, z. B.
.gemini-2.0-flash
- Automatisch aktualisierte Versionen haben Modellnamen ohne Zusatz, z. B.
Vorabversionen bieten neue Funktionen und gelten als nicht stabil. Vorschauversionen verweisen immer auf die aktuelle Vorschauversion dieses Modells. Wenn eine neue Vorschauversion veröffentlicht wird, verweist jede vorhandene Vorschauversion automatisch auf diese neue Vorschauversion.
- Modellnamen von Vorabversionen werden mit
und dem Datum der Erstveröffentlichung des Modells (-preview
) angehängt, z. B.-MMDD
(veröffentlicht am 9. April 2024).gemini-1.5-pro-preview-0409
- Modellnamen von Vorabversionen werden mit
Weitere Informationen zu den verfügbaren Modellversionen und ihrem Lebenszyklus (Gemini) finden Sie in der Google Cloud-Dokumentation.
Verfügbare Modellnamen
Modellnamen sind die expliziten Werte, die Sie in Ihren Code während der Initialisierung des generativen Modells einfügen. Dies ist ein erforderlicher Schritt, um die Gemini API aufzurufen.
Mit dem publishers.models.list
-Endpunkt können Sie alle verfügbaren Modellnamen auflisten. Hinweis: Diese Liste enthält alle Modelle, die von Vertex AI unterstützt werden. Vertex AI in Firebase unterstützt jedoch nur die auf dieser Seite beschriebenen Gemini-Modelle.
Automatisch aktualisierte Versionen (z. B. gemini-2.0-flash
) sind nicht aufgeführt, da sie nur ein Alias für das stabile Basismodell sind.
Gemini-Modellnamen
Beispiele für die Initialisierung in Ihrer Sprache finden Sie im Einstiegsleitfaden.
Gemini 2.0 Flash-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-2.0-flash-001 |
Neueste stabile Version von Gemini 2.0 Flash | General Availability | 2025-02-05 | Noch nicht bekannt |
Automatisch aktualisierte Version | ||||
gemini-2.0-flash |
Verweist auf die aktuelle stabile Version von 2.0 Flash (derzeit gemini-2.0-flash-001 |
General Availability | 2025-02-10 | --- |
Modellnamen von Gemini 1.5 Pro
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-1.5-pro-002 |
Neueste stabile Version von Gemini 1.5 Pro | General Availability | 2024-09-24 | Frühestens am 24.09.2025 |
gemini-1.5-pro-001 |
Erste stabile Version von Gemini 1.5 Pro | General Availability | 2024-05-24 | Frühestens am 24. Mai 2025 |
Automatisch aktualisierte Version | ||||
gemini-1.5-pro |
Verweist auf die aktuelle stabile Version von 1.5 Pro (derzeit gemini-1.5-pro-002 |
General Availability | 2024-09-24 | --- |
Gemini 1.5 Flash-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-1.5-flash-002 |
Neueste stabile Version von Gemini 1.5 Flash | General Availability | 2024-09-24 | Frühestens am 24.09.2025 |
gemini-1.5-flash-001 |
Erste stabile Version von Gemini 1.5 Flash | General Availability | 2024-05-24 | Frühestens am 24. Mai 2025 |
Automatisch aktualisierte Version | ||||
gemini-1.5-flash |
Verweist auf die neueste stabile Version von 1.5 Flash (aktuell gemini-1.5-flash-002 |
General Availability | 2024-09-24 | --- |
Unterstützte Sprachen
Gemini
Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:
Arabisch (ar), Bengalisch (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Deutsch (de), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no) ), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi).
Die Modelle Gemini 1.5 Pro und Gemini 1.5 Flash können in den folgenden zusätzlichen Sprachen verstehen und antworten:
Afrikaans (af), Amharisch (am), Assamesisch (as), Aserbaidschanisch (az), Weißrussisch (be), Bosnisch (bs), Katalanisch (ca), Cebuano (ceb), Korsisch (co), Walisisch (cy), Divehi (dv), Esperanto (eo), Baskisch (eu), Persisch (fa), Filipino (Tagalog) (fil), Friesisch (fy), Irisch (ga), Schottisch-Gälisch (gd), Galicisch (gl), Gujarati (gu), Hausa (ha), Hawaiianisch (haw), Hmong (hmn), Haitianisch-Kreolisch (ht), Armenisch (hy), Igbo (ig), Isländisch (is), Javanisch (jv), Georgisch (ka), Kasachisch (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Lateinisch (la), Luxemburgisch (lb), Laotisch (lo), Malagasy (mg), Maori (mi), Mazedonisch (mk), Malayalam (ml), Mongolisch (mn), Meitei (Manipuri) (mni-Mtei), Marathi (mr), Malaysisch (ms), Maltesisch (mt), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Paschtu (ps), Sindhi (sd), Sinhala (Singhalesisch) (si), Samoanisch (sm), Shona (sn), Somali (so), Albanisch (sq), Sesotho (st), Sundanesisch (su), Tamil (ta), Telugu (te), Tadschikisch (tg), Uigurisch (ug), Urdu (ur), Usbekisch (uz), Xhosa (xh), Jiddisch (yi), Yoruba (yo), Zulu (zu)
Informationen zu älteren Modellen
Vertex AI in Firebase unterstützt alle Gemini-Modelle, einschließlich älterer Modelle wie Gemini 1.0 Pro und Gemini 1.0 Pro Vision. Wir empfehlen jedoch dringend, ein neueres Modell mit unseren SDKs zu verwenden. Diese älteren Gemini-Modelle werden bald eingestellt und bieten nicht alle Funktionen der neueren Modelle.
Weiteres Vorgehen
Funktionen des Gemini API testen
- Unterhaltungen in mehreren Runden (Chat) erstellen
- Text aus nur-Text-Prompts generieren
- Text aus multimodalen Prompts generieren (einschließlich Text, Bildern, PDFs, Videos und Audio).
- Sie können sowohl aus Text- als auch aus multimodalen Prompts strukturierte Ausgabe (z. B. JSON) generieren.
- Verwenden Sie Funktionsaufrufe, um generative Modelle mit externen Systemen und Informationen zu verbinden.