Mit den Vertex AI in Firebase SDKs können Sie bei mobilen und Web-Apps direkt über Ihre App mit den unterstützten Gemini-Modellen interagieren.
Gemini-Modelle gelten als multimodal, da sie mehrere Modalitäten verarbeiten und sogar generieren können, darunter Text, Code, PDFs, Bilder, Video und Audio.
Die folgende Tabelle bietet einen kurzen Überblick über die unterstützten Modelle für Vertex AI in Firebase und ihre neuesten stabilen Modellnamen. In dieser Tabelle sind auch Vorab- und experimentelle Modelle aufgeführt, die für Prototyping-Anwendungsfälle verfügbar sind.
Modell | Eingabe | Ausgabe | Beschreibung |
---|---|---|---|
Gemini-Modelle mit stabilen Versionen | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON (Bilder und Audio bald verfügbar) |
Bietet Funktionen und Geschwindigkeit der nächsten Generation für eine Vielzahl von Aufgaben
(demnächst multimodale Generierung) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON | Bietet eine kostengünstige Leistung mit geringer Latenz und unterstützt einen hohen Durchsatz. |
Gemini 1.5 Progemini-1.5-pro-002 |
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON | Unterstützt komplexe Aufgaben mit höherer Intelligenz; 2 Millionen Zeichen langer Kontext |
Gemini 1.5 Flashgemini-1.5-flash-002 |
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON | Bietet eine schnelle und vielseitige Leistung für eine Vielzahl von Aufgaben |
Gemini-Modelle mit nur Vorab- und experimentellen Versionen (nur für Prototyping-Anwendungsfälle empfohlen) | |||
Gemini 2.0 Progemini-2.0-pro-exp-02-05
|
Text, Code, PDFs, Bilder, Video, Audio | Text, Code, JSON | Bietet die höchste Modellqualität, insbesondere für Code und Weltwissen; 2 Mio. Zeichen langer Kontext |
Gemini 2.0 Flash‑Thinkinggemini-2.0-flash-thinking-exp-01-21
|
Text, Code, PDFs, Bilder | Text, Code, JSON | Bietet stärkere Argumentationskompetenzen und bezieht den Denkprozess in die Antworten ein |
Unterstützt Vertex AI in Firebase ältere Modelle wie Gemini 1.0?
Ja, Vertex AI in Firebase unterstützt alle Gemini-Modelle, einschließlich älterer Modelle.
Modell | Eingabe | Ausgabe | Optimiert für |
---|---|---|---|
Gemini 1.0 Pro Visiongemini-1.0-pro-vision-001
|
Text, Code, PDFs, Bilder, Video (nur Frames) | text, code | Verarbeitet Text, Bilder und Video für Text- oder Codeantworten. Kann nicht für Chats verwendet werden. |
Gemini 1.0 Progemini-1.0-pro-002
|
text, code | text, code | Aufgaben in natürlicher Sprache, Text- und Code-Chats in mehreren Schritten und Codegenerierung |
Unten auf dieser Seite finden Sie detaillierte Informationen zu älteren Modellen. In den häufig gestellten Fragen finden Sie Informationen zu allen Modellen, die von Vertex AI in Firebase unterstützt werden und die nicht unterstützt werden.
Im Rest dieser Seite finden Sie detaillierte Informationen zu den von Vertex AI in Firebase unterstützten Modellen:
-
- Unterstützte Eingabe und Ausgabe
- Grober Vergleich der unterstützten Funktionen
- Spezifikationen und Einschränkungen, z. B. maximale Eingabetokens oder maximale Länge des Eingabevideos
Beschreibung der Versionierung von Modellen, insbesondere der stabilen, automatisch aktualisierten und Vorabversionen
Listen mit verfügbaren Modellnamen, die bei der Initialisierung in Ihren Code aufgenommen werden sollen
Listen der unterstützten Sprachen für die Modelle
Unten auf dieser Seite finden Sie detaillierte Informationen zu älteren Modellen.
Modelle vergleichen
Jedes Modell hat unterschiedliche Funktionen, die für verschiedene Anwendungsfälle geeignet sind. In den Tabellen in diesem Abschnitt wird jedes Modell bei Verwendung mit Vertex AI in Firebase beschrieben. Jedes Modell kann zusätzliche Funktionen haben, die bei der Verwendung unserer SDKs nicht verfügbar sind.
Wenn Sie die gewünschten Informationen in den folgenden Unterabschnitten nicht finden, finden Sie in der Google Cloud-Dokumentation weitere Informationen zu den Gemini-Modellen.
Unterstützte Eingabe und Ausgabe
Die folgenden Eingabe- und Ausgabetypen werden unterstützt, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
|
---|---|---|---|---|---|---|
Eingabetypen | ||||||
Text | ||||||
Code | ||||||
Dokumente (PDFs oder Nur-Text) |
||||||
Bilder | ||||||
Video | ||||||
Audio | ||||||
Audio (Streaming) | Demnächst verfügbar | |||||
Ausgabetypen | ||||||
Text | ||||||
Code | ||||||
Strukturierte Ausgabe (z. B. JSON) |
||||||
Bilder | Demnächst verfügbar | |||||
Audio | Demnächst verfügbar | |||||
Audio (Streaming) | Demnächst verfügbar |
Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Eingabedateien und Anforderungen für die Vertex AI Gemini API.
Unterstützte Funktionen
Die folgenden Funktionen werden unterstützt, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
|
---|---|---|---|---|---|---|
Text aus Text- oder multimodalen Eingaben generieren | ||||||
Bilder erstellen | Demnächst verfügbar | |||||
Audio generieren | Demnächst verfügbar | |||||
Strukturierte Ausgabe generieren
(z. B. JSON) |
||||||
Dokumente analysieren
(PDFs oder Nur-Text) |
||||||
Bilder analysieren (Vision) | ||||||
Videos analysieren (Vision) | ||||||
Audio analysieren | ||||||
Wechselseitiger Chat | ||||||
Funktionsaufrufe (Tools) | ||||||
Tokens und abrechenbare Zeichen zählen | ||||||
Systemanweisungen | ||||||
Multimodal Live API (zweiwegefähiges Streaming) |
Demnächst verfügbar |
Spezifikationen und Einschränkungen
Die folgenden Spezifikationen und Einschränkungen gelten für die Verwendung der einzelnen Modelle mit Vertex AI in Firebase:
Attribut |
<span="notranslate">Gemini 2.0 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Thinking </span="notranslate"> |
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 1.5 Flash </span="notranslate"> |
---|---|---|---|---|---|---|
Kontextfenster * Gesamttokenlimit (Eingabe + Ausgabe) |
2.097.152 Tokens | 1.048.576 Tokens | 1.048.576 Tokens | 1.048.576 Tokens | 2.097.152 Tokens | 1.048.576 Tokens |
Ausgabetokenlimit * | 8.192 Tokens | 8.192 Tokens | 8.192 Tokens | 8.192 Tokens | 8.192 Tokens | 8.192 Tokens |
Datum des Knowledge-Cutoff | Juni 2024 | Juni 2024 | Juni 2024 | Juni 2024 | Mai 2024 | Mai 2024 |
PDFs (auf Anfrage) | ||||||
Maximale Anzahl von Eingabe-PDF-Dateien ** |
3.000 Dateien | 3.000 Dateien | 3.000 Dateien | 3.000 Dateien | 3.000 Dateien | 3.000 Dateien |
Maximale Anzahl der Seiten pro Eingabe-PDF-Datei ** |
1.000 Seiten | 1.000 Seiten | 1.000 Seiten | 1.000 Seiten | 1.000 Seiten | 1.000 Seiten |
Maximale Größe pro Eingabe-PDF-Datei |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB |
Bilder (pro Anfrage) | ||||||
Maximale Anzahl von Eingabebildern |
3.000 Bilder | 3.000 Bilder | 3.000 Bilder | 3.000 Bilder | 3.000 Bilder | 3.000 Bilder |
Maximale Anzahl von Ausgabebildern |
--- | Demnächst verfügbar | --- | --- | --- | --- |
Maximale Größe pro Eingabe mit base64-codiertem Bild |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB |
Video (auf Anfrage) | ||||||
Maximale Anzahl von Eingabevideodateien |
10 Dateien | 10 Dateien | 10 Dateien | --- | 10 Dateien | 10 Dateien |
Maximale Länge des gesamten Eingabevideos (nur Frames) |
~ 60 Minuten | ~ 60 Minuten | ~ 60 Minuten | --- | ~ 60 Minuten | ~ 60 Minuten |
Maximale Länge des gesamten Eingabevideos (Frames + Audio) |
ca. 45 Minuten | ca. 45 Minuten | ca. 45 Minuten | --- | ca. 45 Minuten | ca. 45 Minuten |
Audio (auf Anfrage) | ||||||
Maximale Anzahl von Eingabe-Audiodateien |
1 Datei | 1 Datei | 1 Datei | --- | 1 Datei | 1 Datei |
Maximale Anzahl von Ausgabe-Audiodateien |
--- | Demnächst verfügbar | --- | --- | --- | --- |
Maximale Länge aller Eingabe-Audioinhalte |
~ 8,4 Stunden | ~ 8,4 Stunden | ~ 8,4 Stunden | --- | ~ 8,4 Stunden | ~ 8,4 Stunden |
Maximale Länge aller Audioinhalte |
--- | Demnächst verfügbar | --- | --- | --- | --- |
*
Bei allen Modellen entspricht ein Token etwa 4 Zeichen. 100 Tokens entsprechen also etwa 60–80 englischen Wörtern. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens
ermitteln.
** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein einzelnes Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.
Weitere Informationen
Kontingente und Preise sind für jedes Modell unterschiedlich. Die Preise hängen auch von Eingabe und Ausgabe ab.
Weitere Informationen zu unterstützten Eingabedateitypen, zum Angeben des MIME-Typs und dazu, wie Sie dafür sorgen, dass Ihre Eingabedateien und multimodalen Anfragen die Anforderungen erfüllen und Best Practices einhalten, finden Sie unter Unterstützte Eingabedateien und Anforderungen für die Vertex AI Gemini API.
Versionierung und Benennung von Modellen
Modelle werden in stabilen, Vorabversionen und experimentellen Versionen angeboten. Aus praktischen Gründen werden Aliasse ohne explizite Versionswerte unterstützt.
Informationen zu den Modellnamen, die Sie in Ihrem Code verwenden können, finden Sie weiter unten auf dieser Seite im Abschnitt Verfügbare Modellnamen.
Versionstyp | Beschreibung | Muster für Modellnamen | |
---|---|---|---|
Stabil | Stabile Versionen gelten als allgemein verfügbar. |
An die Modellnamen stabiler Versionen wird eine bestimmte dreistellige Versionsnummer angehängt.
Beispiel: |
|
Automatisch aktualisierter stabiler Alias | Automatisch aktualisierte stabile Aliasse verweisen immer auf die aktuelle stabile Version dieses Modells. Wenn eine neue stabile Version veröffentlicht wird, verweist der Alias auto-updated automatisch auf diese neue stabile Version. |
Modellnamen von Aliassen haben keinen Zusatz
Beispiel: |
|
Vorschau |
Vorabversionen bieten neue Funktionen und gelten als nicht stabil.
Vorschauversionen verweisen immer auf die aktuelle Vorschauversion dieses Modells. Wenn eine neue Vorabversion veröffentlicht wird, verweist jede vorhandene Vorabversion automatisch auf diese neue Vorabversion. |
An die Modellnamen von Vorabversionen werden
Beispiel: |
|
Experimentell | Experimentelle Versionen bieten neue Funktionen, gelten als nicht stabil und folgen nicht dem standardmäßigen Modelllebenszyklusplan und Versionierungsschema von Google. |
An die Modellnamen experimenteller Versionen werden
Beispiel: |
Weitere Informationen zu den verfügbaren Modellversionen und ihrem Lebenszyklus (Gemini) finden Sie in der Google Cloud-Dokumentation.
Verfügbare Modellnamen
Modellnamen sind die expliziten Werte, die Sie in Ihren Code während der Initialisierung des generativen Modells einfügen. Dies ist ein erforderlicher Schritt, um die Gemini API aufzurufen.
Mit dem publishers.models.list
-Endpunkt können Sie alle verfügbaren Modellnamen auflisten. Hinweis: Diese Liste enthält alle Modelle, die von Vertex AI unterstützt werden. Vertex AI in Firebase unterstützt jedoch nur die auf dieser Seite beschriebenen Gemini-Modelle.
Automatisch aktualisierte Aliasse (z. B. gemini-2.0-flash
) sind nicht aufgeführt, da sie nur ein Alias für das Basismodell sind.
Gemini-Modellnamen
Beispiele für die Initialisierung in Ihrer Sprache finden Sie im Einstiegsleitfaden.
Gemini 2.0 Pro-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
Keine stabilen Versionen verfügbar | --- | --- | --- | --- |
Automatisch aktualisierter stabiler Alias | ||||
Kein automatisch aktualisierter stabiler Alias verfügbar | --- | --- | --- | --- |
Vorabversionen | ||||
Keine Vorabversionen verfügbar | --- | --- | --- | --- |
Experimentelle Versionen | ||||
gemini-2.0-pro-exp-02-05 |
Experimentelle Version von Gemini 2.0 Pro | Experimentell | 2025-02-05 | Noch nicht bekannt |
Gemini 2.0 Flash-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-2.0-flash-001 |
Neueste stabile Version von Gemini 2.0 Flash | General Availability | 2025-02-05 | Frühestens am 05.02.2026 |
Automatisch aktualisierter stabiler Alias | ||||
gemini-2.0-flash |
Verweist auf die aktuelle stabile Version von 2.0 Flash (derzeit gemini-2.0-flash-001 |
General Availability | 2025-02-10 | --- |
Vorabversionen | ||||
Keine Vorabversionen verfügbar | --- | --- | --- | --- |
Experimentelle Versionen | ||||
Keine experimentellen Versionen verfügbar | --- | --- | --- | --- |
Gemini 2.0 Flash‑Lite-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-2.0-flash-lite-001 |
Neueste stabile Version von Gemini 2.0 Flash‑Lite | General Availability | 2025-02-25 | Frühestens am 25. Februar 2026 |
Automatisch aktualisierter stabiler Alias | ||||
gemini-2.0-flash-lite |
Verweist auf die aktuelle stabile Version von Flash-Lite 2.0 (derzeit gemini-2.0-flash-lite-001 |
General Availability | 2025-02-25 | --- |
Vorabversionen | ||||
gemini-2.0-flash-lite-preview-02-05 |
Vorabversion von Gemini 2.0 Flash‑Lite | Vorschau | 2025-02-05 | Noch nicht bekannt |
Experimentelle Versionen | ||||
Keine experimentellen Versionen verfügbar | --- | --- | --- | --- |
Gemini 2.0 Flash‑Thinking-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
Keine stabilen Versionen verfügbar | --- | --- | --- | --- |
Automatisch aktualisierter stabiler Alias | ||||
Kein automatisch aktualisierter stabiler Alias verfügbar | --- | --- | --- | --- |
Vorabversionen | ||||
Keine Vorabversionen verfügbar | --- | --- | --- | --- |
Experimentelle Versionen | ||||
gemini-2.0-flash-thinking-exp-01-21 |
Experimentelle Version von Gemini 2.0 Flash‑Thinking | Experimentell | 2025-01-21 | Noch nicht bekannt |
Modellnamen von Gemini 1.5 Pro
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-1.5-pro-002 |
Neueste stabile Version von Gemini 1.5 Pro | General Availability | 2024-09-24 | Frühestens am 24.09.2025 |
gemini-1.5-pro-001 |
Erste stabile Version von Gemini 1.5 Pro | General Availability | 2024-05-24 | Frühestens am 24. Mai 2025 |
Automatisch aktualisierter stabiler Alias | ||||
gemini-1.5-pro |
Verweist auf die aktuellste stabile Version von 1.5 Pro (derzeit gemini-1.5-pro-002 |
General Availability | 2024-09-24 | --- |
Vorabversionen | ||||
Keine Vorabversionen verfügbar | --- | --- | --- | --- |
Experimentelle Versionen | ||||
Keine experimentellen Versionen verfügbar | --- | --- | --- | --- |
Gemini 1.5 Flash-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-1.5-flash-002 |
Neueste stabile Version von Gemini 1.5 Flash | General Availability | 2024-09-24 | Frühestens am 24.09.2025 |
gemini-1.5-flash-001 |
Erste stabile Version von Gemini 1.5 Flash | General Availability | 2024-05-24 | Frühestens am 24. Mai 2025 |
Automatisch aktualisierter stabiler Alias | ||||
gemini-1.5-flash |
Verweist auf die neueste stabile Version von 1.5 Flash (aktuell gemini-1.5-flash-002 |
General Availability | 2024-09-24 | --- |
Vorabversionen | ||||
Keine Vorabversionen verfügbar | --- | --- | --- | --- |
Experimentelle Versionen | ||||
Keine experimentellen Versionen verfügbar | --- | --- | --- | --- |
Unterstützte Sprachen
Gemini
Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:
Arabisch (ar), Bengalisch (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Deutsch (de), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no) ), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi).
Die Modelle Gemini 2.0 Flash, Gemini 1.5 Pro und Gemini 1.5 Flash können die folgenden zusätzlichen Sprachen verstehen und darauf antworten:
Afrikaans (af), Amharisch (am), Assamesisch (as), Aserbaidschanisch (az), Weißrussisch (be), Bosnisch (bs), Katalanisch (ca), Cebuano (ceb), Korsisch (co), Walisisch (cy), Divehi (dv), Esperanto (eo), Baskisch (eu), Persisch (fa), Filipino (Tagalog) (fil), Friesisch (fy), Irisch (ga), Schottisch-Gälisch (gd), Galicisch (gl), Gujarati (gu), Hausa (ha), Hawaiianisch (haw), Hmong (hmn), Haitianisch-Kreolisch (ht), Armenisch (hy), Igbo (ig), Isländisch (is), Javanisch (jv), Georgisch (ka), Kasachisch (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Lateinisch (la), Luxemburgisch (lb), Laotisch (lo), Malagasy (mg), Maori (mi), Mazedonisch (mk), Malayalam (ml), Mongolisch (mn), Meitei (Manipuri) (mni-Mtei), Marathi (mr), Malaysisch (ms), Maltesisch (mt), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Paschtu (ps), Sindhi (sd), Sinhala (Singhalesisch) (si), Samoanisch (sm), Shona (sn), Somali (so), Albanisch (sq), Sesotho (st), Sundanesisch (su), Tamil (ta), Telugu (te), Tadschikisch (tg), Uigurisch (ug), Urdu (ur), Usbekisch (uz), Xhosa (xh), Jiddisch (yi), Yoruba (yo), Zulu (zu)
Informationen zu älteren Modellen
Vertex AI in Firebase unterstützt alle Gemini-Modelle, einschließlich älterer Modelle wie Gemini 1.0 Pro und Gemini 1.0 Pro Vision. Wir empfehlen jedoch dringend, ein neueres Modell mit unseren SDKs zu verwenden. Diese älteren Gemini-Modelle werden bald eingestellt und bieten nicht alle Funktionen der neueren Modelle.
Unterstützte Eingabe- und Ausgabe von älteren Modellen ansehen
Das sind die Eingabe- und Ausgabetypen, die bei Verwendung der einzelnen Modelle mit Vertex AI in Firebase verwendet werden:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |||
---|---|---|---|---|
Eingabetypen | ||||
Text | ||||
Code | ||||
Dokumente (PDFs oder Nur-Text) | ||||
Bild | ||||
Video (nur Frames) | ||||
Video (Frames + Audio) | ||||
Audio | ||||
Ausgabetypen | ||||
Text | ||||
Code | ||||
Bilder, Video und Audio |
Unterstützte Funktionen älterer Modelle
Die folgenden Funktionen sind verfügbar, wenn Sie die einzelnen Modelle mit Vertex AI in Firebase verwenden:
Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|
Text aus nur Text-Eingabe generieren | |||
Text aus multimodaler Eingabe generieren | |||
Bilder, Videos oder Audioinhalte generieren | |||
Strukturierte Ausgabe (z. B. JSON) mithilfe des Antwortschemas generieren | |||
Wechselseitiger Chat | |||
Funktionsaufrufe (Tools) | |||
Grundlegende Funktionsaufrufe | |||
Paralleler Funktionsaufruf | |||
Modus für Funktionsaufrufe | |||
Tokens und abrechenbare Zeichen zählen | |||
Systemanweisungen |
Spezifikationen und Einschränkungen älterer Modelle
Die folgenden Spezifikationen und Einschränkungen gelten für die Verwendung der einzelnen Modelle mit Vertex AI in Firebase:
Attribut | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|
Kontextfenster * Gesamttokenlimit (Eingabe + Ausgabe) |
16.384 Tokens | 32.760 Tokens |
Ausgabetokenlimit * | 2.048 Tokens | 8.192 Tokens |
Datum des Knowledge-Cutoff | Februar 2023 | Februar 2023 |
PDFs (auf Anfrage) | ||
Maximale Anzahl der Eingabe-PDF-Dateien ** | 16 Dateien | --- |
Maximale Seitenzahl pro Eingabe-PDF-Datei ** | 16 Seiten | --- |
Maximale Größe pro Eingabe-PDF-Datei | 50 MB | --- |
Bilder (pro Anfrage) | ||
Maximale Anzahl von Eingabebildern | 16 Bilder | --- |
Maximale Größe pro base64-codiertem Eingabebild | 7 MB | --- |
Video (auf Anfrage) | ||
Maximale Anzahl von Eingabevideodateien | 1 Datei | --- |
Maximale Länge des gesamten Eingabevideos (nur Frames) | 2 Minuten | --- |
Maximale Länge des gesamten Eingabevideos (Frames + Audio) | --- | --- |
Audio (auf Anfrage) | ||
Maximale Anzahl von Eingabe-Audiodateien | --- | --- |
Maximale Länge aller Eingabeaudioinhalte | --- | --- |
*
Bei allen Modellen entspricht ein Token etwa 4 Zeichen. 100 Tokens entsprechen also etwa 60–80 englischen Wörtern. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens
ermitteln.
** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein einzelnes Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.
Verfügbare Modellnamen älterer Modelle
Gemini 1.0 Pro Vision-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-1.0-pro-vision-001 |
Neueste stabile Version von Gemini 1.0 Pro Vision | General Availability | 2024-02-15 | Frühestens am 15.02.2025 |
Automatisch aktualisierter stabiler Alias | ||||
gemini-1.0-pro-vision |
Verweist auf die aktuelle stabile Version von 1.5 Pro Vision (aktuell gemini-1.5-pro-vision-001 |
General Availability | 2024-01-04 | --- |
Gemini 1.0 Pro-Modellnamen
Modellname | Beschreibung | Release-Phase | Datum der Erstveröffentlichung | Einstellungsdatum |
---|---|---|---|---|
Stabile Versionen | ||||
gemini-1.0-pro-002 |
Neueste stabile Version von Gemini 1.0 Pro | General Availability | 2024-04-09 | Frühestens am 09.04.2025 |
gemini-1.0-pro-001 |
Stabile Version von Gemini 1.0 Pro | General Availability | 2024-02-15 | Frühestens am 15.02.2025 |
Automatisch aktualisierter stabiler Alias | ||||
gemini-1.0-pro |
Verweist auf die aktuelle stabile Version von 1.0 Pro (derzeit gemini-1.0-pro-002 |
General Availability | 2024-02-15 | --- |
Weiteres Vorgehen
Funktionen des Gemini API testen
- Unterhaltungen in mehreren Runden (Chat) erstellen
- Text aus nur Text-Prompts generieren
- Text aus multimodalen Prompts generieren (einschließlich Text, Bildern, PDFs, Videos und Audio).
- Sie können sowohl aus Text- als auch aus multimodalen Prompts strukturierte Ausgabe (z. B. JSON) generieren.
- Verwenden Sie Funktionsaufrufe, um generative Modelle mit externen Systemen und Informationen zu verbinden.