Mit den Firebase AI Logic-SDKs für mobile Apps und Web-Apps können Sie direkt über Ihre App mit den unterstützten Gemini-Modellen interagieren.
Gemini-Modelle gelten als multimodal, da sie in der Lage sind, mehrere Modalitäten zu verarbeiten und sogar zu generieren, darunter Text, Code, PDFs, Bilder, Videos und Audio.
Lesen Sie auch unsere FAQs zu allen Modellen, die von Firebase AI Logic unterstützt werden und nicht unterstützt werden.
Modelle für die allgemeine Verwendung
Gemini 3.1. Pro
gemini-3.1-pro-preview
Fortschrittliche Intelligenz, Fähigkeiten zur Lösung komplexer Probleme und leistungsstarke Funktionen für die Codierung von Agenten und Vibe.
Gemini 3 Flash
gemini-3-flash-preview
Leistung der Frontier-Klasse, die mit größeren Modellen mithalten kann, zu einem Bruchteil der Kosten.
Gemini 3.1 Flash-Lite
gemini-3.1-flash-lite-preview
Kostengünstiges Modell für Aufgaben mit hohem Volumen mit der Leistung und Qualität der Gemini 3-Serie.
Gemini 2.5 Pro
gemini-2.5-pro
Unser fortschrittlichstes Modell für komplexe Aufgaben der Gemini 2.5-Serie mit umfassenden Fähigkeiten in den Bereichen logisches Denken und Programmieren.
Gemini 2.5 Flash
gemini-2.5-flash
Unser bestes Preis-Leistungs-Modell der Gemini 2.5‑Serie, insbesondere für latenzarme Aufgaben mit hohem Volumen, die Schlussfolgerungen erfordern.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Das schnellste und kostengünstigste multimodale Modell der Gemini 2.5-Reihe.
Modelle zur Bildgenerierung
Sie können Bilder mit Gemini-Modellen generieren und bearbeiten.
Gemini
Gemini 3 Pro Image (Nano Banana Pro)
gemini-3-pro-image-preview
für die professionelle Asset-Produktion entwickelt, wobei fortschrittliche Schlussfolgerungen („Thinking“) verwendet werden, um komplexe Anweisungen zu befolgen und Text mit hoher Genauigkeit zu rendern.
Gemini 3.1 Flash Image (Nano Banana 2)
gemini-3.1-flash-image-preview
Hocheffizientes Gegenstück zu Gemini 3 Pro Image, optimiert für Geschwindigkeit und Anwendungsfälle mit hohem Volumen für Entwickler.
Gemini 2.5 Flash Image (Nano Banana)
gemini-2.5-flash-image
Für Geschwindigkeit und Effizienz entwickelt und für Aufgaben mit hohem Volumen und niedriger Latenz optimiert.
Imagen (eingestellt)
Weitere Informationen zu Imagen-Modellen finden Sie weiter unten auf dieser Seite unter Ältere Imagen-Modelle.
Modelle zur Audiogenerierung
Sie können gestreamte Audioausgabe mit Modellen generieren, die die Gemini Live API unterstützen.
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
Gemini Developer API: gemini-2.5-flash-native-audio-preview-12-2025
Vertex AI Gemini API: gemini-live-2.5-flash-native-audio
Ermöglicht latenzarme Sprach- und Videointeraktionen in Echtzeit mit einem bidirektionalen Gemini-Modell.
Auf dem Rest dieser Seite finden Sie detaillierte Informationen zu den von Firebase AI Logic unterstützten Modellen.
-
- Unterstützte Ein- und Ausgaben
- Vergleich der unterstützten Funktionen
- Spezifikationen und Einschränkungen, z. B. maximale Anzahl von Eingabetokens oder maximale Länge des Eingabevideos
Beschreibung der Versionsverwaltung von Modellen, insbesondere der Versionen stabil, automatisch aktualisiert, Vorschau und experimentell
Listen der verfügbaren Modellnamen, die bei der Initialisierung in Ihren Code aufgenommen werden sollen.
Listen der unterstützten Sprachen für die Modelle
Unten auf dieser Seite finden Sie detaillierte Informationen zu Modellen der vorherigen Generation.
Modelle vergleichen
Jedes Modell hat unterschiedliche Funktionen für verschiedene Anwendungsfälle. In den Tabellen in diesem Abschnitt wird jedes Modell in Kombination mit Firebase AI Logic beschrieben. Jedes Modell kann zusätzliche Funktionen haben, die bei Verwendung unserer SDKs nicht verfügbar sind.
Wenn Sie die gesuchten Informationen in den folgenden Unterabschnitten nicht finden, können Sie in der Dokumentation Ihres API-Anbieters nachsehen: Gemini Developer API oder Vertex AI Gemini API.
Unterstützte Ein- und Ausgaben
Dies sind die unterstützten Ein- und Ausgabetypen bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
|
<span="notranslate">Gemini 3 und 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 & 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Eingabetypen | |||||
| Text | (Streaming) | ||||
| Code | |||||
| Dokumente (PDFs oder Nur-Text) |
|||||
| Bilder | |||||
| Video | (Streaming) | ||||
| Audio | (Streaming) | ||||
| Ausgabetypen | |||||
| Text | |||||
| Text (Streaming) | (Transkription) | ||||
| Code | |||||
| Strukturierte Ausgabe (z. B. JSON) |
|||||
| Bilder | |||||
| Audio | (Streaming) | ||||
Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Eingabedateien und Anforderungen.
Unterstützte Funktionen
Das sind die unterstützten Funktionen und Features bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
|
<span="notranslate">Gemini 3 und 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 & 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Denken | |||||
| Text generieren aus Nur-Text- oder multimodalen Eingaben | eingebettet oder als Teil des Bildes | eingebettet oder als Teil des Bildes | Nur Transkription | ||
| Bilder generieren | |||||
| Bilder bearbeiten | |||||
| Audio generieren | Nur Streaming | ||||
|
Strukturierte Ausgabe generieren
(z. B. JSON) |
|||||
|
Dokumente analysieren
(PDFs oder Nur-Text) |
|||||
| Bilder analysieren (Vision) | |||||
| Video analysieren (Vision) | Nur Streaming | ||||
| Audio analysieren | Nur Streaming | ||||
| Wechselseitiger Chat | Nur Streaming | ||||
| Bidirektionales multimodales Streaming | |||||
| Systemanweisungen | |||||
| Tokens zählen |
Unterstützte Tools
Das sind die unterstützten Tools, wenn Sie die einzelnen Modelle mit Firebase AI Logic verwenden:|
<span="notranslate">Gemini 3 und 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 & 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Funktionsaufrufe | |||||
| Codeausführung | |||||
| URL-Kontext | |||||
| Fundierung mit der Google Suche |
Spezifikationen und Einschränkungen
Hier finden Sie die Spezifikationen und Einschränkungen für die Verwendung der einzelnen Modelle mit Firebase AI Logic:
| Attribut |
<span="notranslate">Gemini 3 und 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 & 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|---|---|---|---|---|---|
| Eingabetokenlimit * | 1.048.576 Tokens | 65.536 Tokens | 1.048.576 Tokens | 32.768 Tokens | 32.000 Tokens (Standard; Upgrade auf 128.000 Tokens möglich) |
| Tokenausgabelimit* | 65.536 Tokens | 32.768 Tokens | 65.536 Tokens | 8.192 Tokens | 64.000 Tokens |
| Wissensstichtag | Januar 2025 | Januar 2025 | Januar 2025 | Juni 2025 | Januar 2025 |
| PDFs (auf Anfrage) | |||||
| Maximale Anzahl von PDF-Eingabedateien** |
900 Dateien | 14 Dateien | 3.000 Dateien | 3 Dateien | --- |
| Maximale Anzahl von Seiten pro PDF-Eingabedatei** |
900 Seiten | 14 Seiten | 1.000 Seiten | 3 Seiten | --- |
| Maximale Größe pro PDF-Eingabedatei |
50 MB | 50 MB | 50 MB | 50 MB | --- |
| Bilder (pro Anfrage) | |||||
| Maximale Anzahl von Eingabebildern |
1.000 Bilder | 14 Bilder | 3.000 Bilder | 3 Bilder | --- |
| Maximale Anzahl von Ausgabebildern |
--- | 10 Bilder | --- | 10 Bilder | --- |
| Maximale Größe eines base64-codierten Eingabebildes |
7 MB | 7 MB | 7 MB | 7 MB | --- |
| Video (auf Anfrage) | |||||
| Maximale Anzahl von Eingabevideodateien |
10 Dateien | --- | 10 Dateien | --- | --- |
| Maximale Länge aller Eingabevideos (nur Frames) |
~ 60 Minuten | --- | ~ 60 Minuten | --- | --- |
| Maximale Länge aller Eingabevideos (Bilder + Audio) |
~ 45 Minuten | --- | ~ 45 Minuten | --- | --- |
| Audio (pro Anfrage) | |||||
| Maximale Anzahl von Eingabe-Audiodateien |
1 Datei | --- | 1 Datei | --- | --- |
| Maximale Anzahl von Ausgabe-Audiodateien |
--- | --- | --- | --- | --- |
| Maximale Länge aller Eingabe-Audiodateien |
ca.8,4 Stunden | --- | ca.8,4 Stunden | --- | --- |
| Maximale Länge aller Ausgabe-Audiodateien |
--- | --- | --- | --- | --- |
*
Bei allen Gemini-Modellen entspricht ein Token etwa vier Zeichen. 100 Tokens entsprechen also etwa 60–80 englischen Wörtern. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens ermitteln.
** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.
*** Gemini 2.5 Flash-Live-Modelle sind die nativen Audiomodelle, die Gemini Live API unterstützen.
Weitere detaillierte Informationen finden
Kontingente und Preise sind für jedes Modell unterschiedlich. Die Preise hängen auch von der Eingabe und Ausgabe ab.
Weitere Informationen zu unterstützten Eingabedateitypen, zum Angeben des MIME-Typs und dazu, wie Sie dafür sorgen, dass Ihre Eingabedateien und multimodalen Anfragen den Anforderungen entsprechen und die Best Practices in Unterstützte Eingabedateien und Anforderungen befolgen, finden Sie dort.
Modellversionsverwaltung und Namensmuster
Modelle werden in stabilen, Vorschau- und experimentellen Versionen angeboten. Zur Vereinfachung werden Aliase ohne explizite Versionswerte unterstützt.
Informationen dazu, wie Sie bestimmte Modellnamen für Ihren Code finden, finden Sie weiter unten auf dieser Seite im Abschnitt Verfügbare Modellnamen.
| Versionstyp / Releasestufe |
Beschreibung | Muster für Modellnamen | |
|---|---|---|---|
| Stabil |
Stabile Versionen sind ab dem Veröffentlichungsdatum für die Produktion verfügbar und werden unterstützt.
|
|
|
| Automatisch aktualisierter stabiler Alias (nur Gemini 2.0-Modelle) |
Automatisch aktualisierte stabile Aliase verweisen immer auf die neueste stabile Version des jeweiligen Modells.
|
Nur Gemini 2.0-Modelle
Beispiel: |
|
| Vorschau |
Vorschauversionen haben neue Funktionen und gelten als nicht stabil.
|
An die Modellnamen von Vorschauversionen wird
Beispiele: |
|
| Experimentell |
Experimentelle Versionen haben neue Funktionen und gelten als nicht stabil.
|
An die Modellnamen von experimentellen Versionen wird
Beispiel: |
|
| Rentner |
Eingestellte Versionen sind nach dem Einstellungsdatum endgültig deaktiviert.
|
--- |
|
Verfügbare Modellnamen
Modellnamen sind die expliziten Werte, die Sie in Ihren Code einfügen, wenn Sie das Modell initialisieren.
Zu Gemini-Modellnamen springen Zu Imagen-Modellnamen springen (eingestellt)
Alle verfügbaren Modelle programmatisch auflisten
Sie können alle verfügbaren Modellnamen mit der REST API auflisten:
Gemini Developer API: Rufe den Endpunkt
models.listauf.Vertex AI Gemini API: Rufe den Endpunkt
publishers.models.listauf.
Die zurückgegebene Liste enthält alle von den API-Anbietern unterstützten Modelle. Firebase AI Logic unterstützt jedoch nur die auf dieser Seite beschriebenen Modelle Gemini und Imagen.
Automatisch aktualisierte Aliase (z. B. gemini-2.0-flash) werden nicht aufgeführt, da sie ein Alias für das Basismodell sind.
Gemini Modellnamen
Beispiele für die Initialisierung für Ihre Plattform finden Sie im Startleitfaden.
Weitere Informationen zu den Release-Phasen (insbesondere zu Anwendungsfällen, Abrechnung und Herunterfahren) finden Sie unter Versionsverwaltung und Benennungsmuster für Modelle.
Gemini 3.1 Pro Modellnamen
Erfordert den Blaze-Tarif (Pay as you go) unabhängig von Ihrem Gemini API-Anbieter.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3.1-pro-preview |
Aktuelle Vorschauversion von Gemini 3 Pro | Vorschau | 2026-02-19 | Noch nicht bekannt |
Gemini 3 Flash Modellnamen
Nicht erforderlich, wenn Sie den „Pay as you go“-Tarif „Blaze“ verwenden und Gemini Developer API nutzen (für Vorschaumodelle ist in der Regel ein kostenpflichtiger Tarif erforderlich).
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3-flash-preview |
Vorschauversion von Gemini 3 Flash | Vorschau | 2025-12-17 | Noch nicht bekannt |
Gemini 3.1 Flash‑Lite Modellnamen
Nicht erforderlich, wenn Sie den „Pay as you go“-Tarif „Blaze“ verwenden und Gemini Developer API nutzen (für Vorschaumodelle ist in der Regel ein kostenpflichtiger Tarif erforderlich).
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3.1-flash-lite-preview |
Vorschauversion von Gemini 3.1 Flash‑Lite | Vorschau | 2026-03-03 | Noch nicht bekannt |
Gemini 3 Pro Image-Modellnamen (auch „Nano Banana Pro“)
Erfordert den Blaze-Tarif (Pay as you go) unabhängig von Ihrem Gemini API-Anbieter.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3-pro-image-preview |
Vorschauversion von Gemini 3 Pro Image (auch „Nano Banana Pro“) |
Vorschau | 2025-11-20 | Noch nicht bekannt |
Gemini 3.1 Flash Image-Modellnamen (auch „Nano Banana 2“)
Erfordert den Blaze-Tarif (Pay as you go) unabhängig von Ihrem Gemini API-Anbieter.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3.1-flash-image-preview |
Vorschauversion von Gemini 3.1 Flash Image (auch „Nano Banana 2“) |
Vorschau | 2026-02-26 | Noch nicht bekannt |
Gemini 2.5 Pro Modellnamen
Nicht erforderlich, wenn Sie die Gemini Developer API verwenden.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-pro |
Stabile Version von Gemini 2.5 Pro | Stabil | 2025-06-17 | Frühestens am 2026-06-17 |
Gemini 2.5 Flash Modellnamen
Nicht erforderlich, wenn Sie die Gemini Developer API verwenden.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash |
Stabile Version von Gemini 2.5 Flash | Stabil | 2025-06-17 | Frühestens am 2026-06-17 |
Gemini 2.5 Flash‑Lite Modellnamen
Nicht erforderlich, wenn Sie die Gemini Developer API verwenden.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Stabile Version von Gemini 2.5 Flash‑Lite | Stabil | 2025-07-22 | Frühestens am 2026-07-22 |
Gemini 2.5 Flash Image-Modellnamen (auch „Nano Banana“)
Erfordert den Blaze-Tarif (Pay as you go) unabhängig von Ihrem Gemini API-Anbieter.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash-image |
Stabile Version für Gemini 2.5 Flash Image (auch „Nano Banana“) | Stabil | 2025-10-02 | Frühestens am 2026-10-02 |
Gemini 2.5 Flash Live Modellnamen
Nicht erforderlich, wenn Sie den „Pay as you go“-Tarif „Blaze“ verwenden und Gemini Developer API nutzen (für Vorschaumodelle ist in der Regel ein kostenpflichtiger Tarif erforderlich).
Gemini 2.5 Flash Live-Modelle sind die nativen Audiomodelle, die Gemini Live API unterstützen. Auch wenn das Modell je nach Gemini-API-Anbieter unterschiedliche Modellnamen hat, sind das Verhalten und die Funktionen des Modells gleich.
| Gemini Developer API Modellname |
Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 |
Aktuelle Vorschauversion für das Live API auf dem Gemini Developer API | Vorschau | 2025-12-12 | Noch nicht bekannt |
gemini-2.5-flash-native-audio-preview-09-2025 1 |
Erste Vorschauversion für Live API auf Gemini Developer API | Vorschau | 2025-09-18 | Noch nicht bekannt |
| Vertex AI Gemini API Modellname |
Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 |
Stabile Version für das Live API auf dem Vertex AI Gemini API | Stabil | 2025-12-12 | Frühestens am 2026-12-12 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 |
Vorschauversion für Live API auf Vertex AI Gemini API | Vorschau | 2025-09-18 | Noch nicht bekannt |
1 Nur vom Gemini Developer API unterstützt.
Obwohl es sich um Vorabmodelle handelt, sind sie im Gemini Developer API im Rahmen des kostenlosen Kontingents verfügbar.
2 Nur von Vertex AI Gemini API unterstützt.
Außerdem werden diese Modelle am Standort global nicht unterstützt.
Imagen-Modellnamen (eingestellt)
Informationen zu Imagen-Modellnamen finden Sie weiter unten auf dieser Seite unter Ältere Imagen-Modelle.
Unterstützte Sprachen
Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:
Arabisch (ar), Bengalisch (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Deutsch (de), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no) ), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi).
Die Modelle Gemini 2.0 Flash, Gemini 1.5 Pro und Gemini 1.5 Flash können die folgenden zusätzlichen Sprachen verstehen und darauf antworten:
Afrikaans (af), Amharisch (am), Assamesisch (as), Aserbaidschanisch (az), Weißrussisch (be), Bosnisch (bs), Katalanisch (ca), Cebuano (ceb), Korsisch (co), Walisisch (cy), Divehi (dv), Esperanto (eo), Baskisch (eu), Persisch (fa), Filipino (Tagalog) (fil), Friesisch (fy), Irisch (ga), Schottisch-Gälisch (gd), Galicisch (gl), Gujarati (gu), Hausa (ha), Hawaiianisch (haw), Hmong (hmn), Haitianisch-Kreolisch (ht), Armenisch (hy), Igbo (ig), Isländisch (is), Javanisch (jv), Georgisch (ka), Kasachisch (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Lateinisch (la), Luxemburgisch (lb), Laotisch (lo), Malagasy (mg), Maori (mi), Mazedonisch (mk), Malayalam (ml), Mongolisch (mn), Meitei (Manipuri) (mni-Mtei), Marathi (mr), Malaysisch (ms), Maltesisch (mt), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Paschtu (ps), Sindhi (sd), Sinhala (Singhalesisch) (si), Samoanisch (sm), Shona (sn), Somali (so), Albanisch (sq), Sesotho (st), Sundanesisch (su), Tamil (ta), Telugu (te), Tadschikisch (tg), Uigurisch (ug), Urdu (ur), Usbekisch (uz), Xhosa (xh), Jiddisch (yi), Yoruba (yo), Zulu (zu)
Informationen zu früheren Modellen
Die folgenden Modelle sind aktiv, gehören aber zur vorherigen Generation. Wir empfehlen, nach Möglichkeit eines der neuesten Modelle zu verwenden.
Wenn Sie die gewünschten Informationen in den folgenden Unterabschnitten nicht finden, können Sie noch mehr Informationen in der Dokumentation des von Ihnen ausgewählten API-Anbieters finden:
Gemini Developer API: Gemini-Modelle und Imagen-Modelle
Vertex AI Gemini API: Gemini-Modelle und Imagen-Modelle
Ältere Gemini-Modelle
gemini-2.0-flash-001(und der automatisch aktualisierte Aliasgemini-2.0-flash)gemini-2.0-flash-lite-001(und der automatisch aktualisierte Aliasgemini-2.0-flash-lite)
Informationen zu älteren Gemini Live API-Modellen finden Sie in der Dokumentation des Gemini API-Anbieters:
Ältere Imagen-Modelle
imagen-4.0-ultra-generate-001imagen-4.0-generate-001imagen-4.0-fast-generate-001imagen-3.0-capability-001imagen-3.0-generate-002imagen-3.0-generate-001imagen-3.0-fast-generate-001
Details zu früheren Modellen ansehen
Nächste Schritte
Funktionen von Gemini API ausprobieren
- Wechselseitige Unterhaltungen (Chat) erstellen
- Text aus reinen Text-Prompts generieren
- Sie können Text generieren, indem Sie Prompts mit verschiedenen Dateitypen wie Bildern, PDFs, Videos und Audiodateien verwenden.
- Strukturierte Ausgabe (z. B. JSON) generieren sowohl aus Text- als auch aus multimodalen Prompts.
- Bilder aus Text- und multimodalen Prompts generieren und bearbeiten
- Stream-Ein- und -Ausgabe (einschließlich Audio) mit Gemini Live API.
- Verwenden Sie Tools wie Funktionsaufrufe und Fundierung mit der Google Suche, um ein Gemini-Modell mit anderen Teilen Ihrer App sowie mit externen Systemen und Informationen zu verbinden.