Mit den Firebase AI Logic-SDKs für mobile Apps und Web-Apps können Sie direkt aus Ihrer App mit den unterstützten Gemini-Modellen und Imagen-Modellen interagieren.
Gemini-Modelle gelten als multimodal, da sie in der Lage sind, mehrere Modalitäten zu verarbeiten und sogar zu generieren, darunter Text, Code, PDFs, Bilder, Videos und Audio. Imagen-Modelle können mit Text-Prompts aufgefordert werden, Bilder zu generieren.
Lesen Sie auch unsere FAQs zu allen Modellen, die von Firebase AI Logic unterstützt werden und nicht unterstützt werden.
Modelle für die allgemeine Verwendung
Gemini 3 Pro
gemini-3-pro-preview
Unser bestes Modell für multimodales Verstehen und unser bisher leistungsstärkstes agentisches Vibe-Coding-Modell. Es ermöglicht besonders ansprechende Visualisierungen und mehr Interaktivität – alles auf Grundlage modernster Schlussfolgerungsfunktionen.
Gemini 3 Flash
gemini-3-flash-preview
Unser bisher leistungsstärkstes Modell, das auf Geschwindigkeit, Effizienz und Kosten optimiert ist.
Es ermöglicht alltägliche Aufgaben mit verbesserter Argumentation und kann dennoch die komplexesten agentischen Workflows bewältigen.
Gemini 2.5 Pro
gemini-2.5-pro
Unser hochmodernes Denkmodell kann komplexe Probleme in den Bereichen Programmieren, Mathematik und MINT lösen sowie große Datasets, Codebasen und Dokumente mit langem Kontext analysieren.
Gemini 2.5 Flash
gemini-2.5-flash
Unser bestes Modell in Bezug auf das Preis-Leistungs-Verhältnis mit umfassenden Funktionen. 2.5 Flash eignet sich am besten für die Verarbeitung im großen Maßstab, Aufgaben mit niedriger Latenz und hohem Volumen, die Denkprozesse erfordern, sowie für agentenbasierte Anwendungsfälle.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Unser schnellstes Flash-Modell, optimiert für Kosteneffizienz und hohen Durchsatz.
Modelle zur Bildgenerierung
Sie können Bilder mit den Modellen Gemini oder Imagen generieren.
Gemini
Gemini 3 Pro Image (auch bekannt als nano banana pro)
gemini-3-pro-image-preview
Für die professionelle Asset-Produktion und komplexe Anweisungen entwickelt. Sie bietet eine realistische Grundlage durch Google Suche, einen standardmäßigen „Denkprozess“, der die Komposition vor der Generierung verfeinert, und kann Bilder mit einer Auflösung von bis zu 4K generieren.
Gemini 2.5 Flash Image (auch bekannt als Nano-Banana)
gemini-2.5-flash-image
Für Geschwindigkeit und Effizienz entwickelt. Es ist für Aufgaben mit hohem Volumen und geringer Latenz optimiert und generiert Bilder mit einer Auflösung von 1.024 Pixeln.
Imagen
Imagen 4
imagen-4.0-generate-001
Generiert realistische, hochwertige Bilder aus Text-Prompts in natürlicher Sprache.
Imagen 4 Fast
imagen-4.0-fast-generate-001
Generiert Bilder für Prototypen oder Anwendungsfälle mit niedriger Latenz.
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
Generiert realistische, hochwertige Bilder aus Text-Prompts in natürlicher Sprache.
Modelle zur Audiogenerierung
Sie können gestreamtes Audio mit Modellen generieren, die die Gemini Live API unterstützen.
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
Gemini Developer API: gemini-2.5-flash-native-audio-preview-12-2025
Vertex AI Gemini API: gemini-live-2.5-flash-native-audio
Ermöglicht latenzarme Sprach- und Videointeraktionen in Echtzeit mit einem bidirektionalen Gemini-Modell.
Auf dem Rest dieser Seite finden Sie detaillierte Informationen zu den von Firebase AI Logic unterstützten Modellen.
-
- Unterstützte Ein- und Ausgaben
- Vergleich der unterstützten Funktionen
- Spezifikationen und Einschränkungen, z. B. maximale Anzahl von Eingabetokens oder maximale Länge des Eingabevideos
Beschreibung der Versionsverwaltung von Modellen, insbesondere der Versionen stabil, automatisch aktualisiert, Vorschau und experimentell
Listen der verfügbaren Modellnamen, die bei der Initialisierung in Ihren Code aufgenommen werden sollen.
Listen der unterstützten Sprachen für die Modelle
Unten auf dieser Seite finden Sie detaillierte Informationen zu Modellen der vorherigen Generation.
Modelle vergleichen
Jedes Modell hat unterschiedliche Funktionen für verschiedene Anwendungsfälle. In den Tabellen in diesem Abschnitt wird jedes Modell in Kombination mit Firebase AI Logic beschrieben. Jedes Modell kann zusätzliche Funktionen haben, die bei Verwendung unserer SDKs nicht verfügbar sind.
Wenn Sie die gewünschten Informationen in den folgenden Unterabschnitten nicht finden, können Sie noch mehr Informationen in der Dokumentation des von Ihnen ausgewählten API-Anbieters finden:
Gemini Developer API: Gemini-Modelle und Imagen-Modelle
Vertex AI Gemini API: Gemini-Modelle und Imagen-Modelle
Unterstützte Ein- und Ausgaben
Dies sind die unterstützten Ein- und Ausgabetypen bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro, Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen (generieren) | Imagen (Funktion) | |
|---|---|---|---|---|---|---|---|
| Eingabetypen | |||||||
| Text | (Streaming) | ||||||
| Code | |||||||
| Dokumente (PDFs oder Nur-Text) |
|||||||
| Bilder | |||||||
| Video | (Streaming) | ||||||
| Audio | (Streaming) | ||||||
| Ausgabetypen | |||||||
| Text | |||||||
| Text (Streaming) | (Transkription) | ||||||
| Code | |||||||
| Strukturierte Ausgabe (z. B. JSON) |
|||||||
| Bilder | |||||||
| Audio | (Streaming) | ||||||
Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Eingabedateien und Anforderungen.
Unterstützte Funktionen
Das sind die unterstützten Funktionen und Features bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro, Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen (generieren) | Imagen (Funktion) | |
|---|---|---|---|---|---|---|---|
| Denken | |||||||
| Text generieren aus Nur-Text- oder multimodalen Eingaben | verschachtelt oder als Teil des Bildes | verschachtelt oder als Teil des Bildes | Nur Transkription | ||||
|
Bilder generieren (Gemini oder Imagen) |
|||||||
|
Bilder bearbeiten (Gemini oder Imagen) |
|||||||
| Audio generieren | Nur Streaming | ||||||
|
Strukturierte Ausgabe generieren
(z. B. JSON) |
|||||||
|
Dokumente analysieren
(PDFs oder Nur-Text) |
|||||||
| Bilder analysieren (Vision) | |||||||
| Video analysieren (Vision) | Nur Streaming | ||||||
| Audio analysieren | Nur Streaming | ||||||
| Wechselseitiger Chat | Nur Streaming | ||||||
| Bidirektionales multimodales Streaming | |||||||
| Funktionsaufrufe | |||||||
| Codeausführung | |||||||
| Fundierung mit der Google Suche | |||||||
| Systemanweisungen | |||||||
| Tokens zählen |
Spezifikationen und Einschränkungen
Hier finden Sie die Spezifikationen und Einschränkungen bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
| Attribut |
<span="notranslate">Gemini 3 Pro, Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Live *** </span="notranslate"> |
Imagen (generieren) | Imagen (Funktion) |
|---|---|---|---|---|---|---|---|
| Eingabetokenlimit * | 1.048.576 Tokens | 65.536 Tokens | 1.048.576 Tokens | 32.768 Tokens | 32.000 Tokens (Standard; Upgrade auf 128.000 Tokens möglich) | 480 Tokens | 480 Tokens |
| Tokenausgabelimit* | 65.536 Tokens | 32.768 Tokens | 65.536 Tokens | 8.192 Tokens | 64.000 Tokens | --- | --- |
| Wissensstichtag | Januar 2025 | Januar 2025 | Januar 2025 | Juni 2025 | Januar 2025 | --- | --- |
| PDFs (auf Anfrage) | |||||||
| Maximale Anzahl von PDF-Eingabedateien ** |
900 Dateien | 14 Dateien | 3.000 Dateien | 3 Dateien | --- | --- | --- |
| Maximale Anzahl von Seiten pro PDF-Eingabedatei** |
900 Seiten | 14 Seiten | 1.000 Seiten | 3 Seiten | --- | --- | --- |
| Maximale Größe pro PDF-Eingabedatei |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | --- |
| Bilder (pro Anfrage) | |||||||
| Maximale Anzahl von Eingabebildern |
1.000 Bilder | 14 Bilder | 3.000 Bilder | 3 Bilder | --- | --- | 4 Bilder |
| Maximale Anzahl von Ausgabebildern |
--- | 10 Bilder | --- | 10 Bilder | --- | 4 Bilder | 4 Bilder |
| Maximale Größe pro base64-codiertem Eingabebild |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | --- |
| Video (auf Anfrage) | |||||||
| Maximale Anzahl von Eingabevideodateien |
10 Dateien | --- | 10 Dateien | --- | --- | --- | --- |
| Maximale Länge aller Eingabevideos (nur Frames) |
~ 60 Minuten | --- | ~ 60 Minuten | --- | --- | --- | --- |
| Maximale Länge aller Eingabevideos (Bilder + Audio) |
~ 45 Minuten | --- | ~ 45 Minuten | --- | --- | --- | --- |
| Audio (pro Anfrage) | |||||||
| Maximale Anzahl von Eingabe-Audiodateien |
1 Datei | --- | 1 Datei | --- | --- | --- | --- |
| Maximale Anzahl von Ausgabe-Audiodateien |
--- | --- | --- | --- | --- | --- | --- |
| Maximale Länge aller Eingabe-Audiodateien |
ca.8,4 Stunden | --- | ca.8,4 Stunden | --- | --- | --- | --- |
| Maximale Länge aller Ausgabe-Audiodateien |
--- | --- | --- | --- | --- | --- | --- |
*
Bei allen Gemini-Modellen entspricht ein Token etwa 4 Zeichen. 100 Tokens entsprechen also etwa 60–80 Wörtern im Englischen. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens ermitteln.
** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.
*** Gemini 2.5 Flash-Live-Modelle sind die nativen Audiomodelle, die Gemini Live API unterstützen.
Weitere detaillierte Informationen finden
Kontingente und Preise sind für jedes Modell unterschiedlich. Die Preise hängen auch von der Eingabe und Ausgabe ab.
Informationen zu unterstützten Eingabedateitypen, zum Angeben des MIME-Typs und dazu, wie Sie dafür sorgen, dass Ihre Eingabedateien und multimodalen Anfragen den Anforderungen entsprechen und die Best Practices in Unterstützte Eingabedateien und Anforderungen eingehalten werden.
Modellversionsverwaltung und Namensmuster
Modelle werden in stabilen, Vorschau- und experimentellen Versionen angeboten. Zur Vereinfachung werden Aliase ohne explizite Versionswerte unterstützt.
Informationen dazu, wie Sie bestimmte Modellnamen für Ihren Code finden, finden Sie weiter unten auf dieser Seite im Abschnitt Verfügbare Modellnamen.
| Versionstyp / Releasestufe |
Beschreibung | Muster für Modellnamen | |
|---|---|---|---|
| Stabil |
Stabile Versionen sind ab dem Veröffentlichungsdatum für die Produktion verfügbar und werden unterstützt.
|
|
|
| Automatisch aktualisierter stabiler Alias (nur Gemini 2.0-Modelle) |
Automatisch aktualisierte stabile Aliase verweisen immer auf die neueste stabile Version des jeweiligen Modells.
|
Nur Gemini 2.0-Modelle
Beispiel: |
|
| Vorschau |
Vorschauversionen haben neue Funktionen und gelten als nicht stabil.
|
An die Modellnamen von Vorschauversionen wird
Beispiele: |
|
| Experimentell |
Experimentelle Versionen haben neue Funktionen und gelten als nicht stabil.
|
An die Modellnamen von experimentellen Versionen wird
Beispiel: |
|
| Rentner |
Eingestellte Versionen sind nach dem Einstellungsdatum endgültig deaktiviert.
|
--- |
|
Verfügbare Modellnamen
Modellnamen sind die expliziten Werte, die Sie in Ihren Code bei der Initialisierung des Modells einfügen.
Zu Gemini-Modellnamen springen Zu Imagen-Modellnamen springen
Alle verfügbaren Modelle programmatisch auflisten
Sie können alle verfügbaren Modellnamen mit der REST API auflisten:
Gemini Developer API: Ruft den Endpunkt
models.listauf.Vertex AI Gemini API: Ruft den Endpunkt
publishers.models.listauf.
Die zurückgegebene Liste enthält alle von den API-Anbietern unterstützten Modelle. Firebase AI Logic unterstützt jedoch nur die auf dieser Seite beschriebenen Modelle Gemini und Imagen.
Automatisch aktualisierte Aliase (z. B. gemini-2.0-flash) werden nicht aufgeführt, da sie ein Alias für das Basismodell sind.
Gemini Modellnamen
Beispiele für die Initialisierung für Ihre Plattform finden Sie im Startleitfaden.
Weitere Informationen zu den Release-Phasen (insbesondere zu Anwendungsfällen, Abrechnung und Einstellung) finden Sie unter Versionsverwaltung und Benennungsmuster für Modelle.
Gemini 3 Pro Modellnamen
Erfordert den Blaze-Tarif (Pay as you go) unabhängig von Ihrem Gemini API-Anbieter.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3-pro-preview |
Vorschauversion von Gemini 3 Pro | Vorschau | 2025-11-18 | Noch nicht bekannt |
Gemini 3 Flash Modellnamen
Nicht erforderlich, wenn Sie den „Pay as you go“-Tarif „Blaze“ verwenden und Gemini Developer API nutzen (für Vorschaumodelle ist in der Regel ein kostenpflichtiger Tarif erforderlich).
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3-flash-preview |
Vorschauversion von Gemini 3 Flash | Vorschau | 2025-12-17 | Noch nicht bekannt |
Gemini 3 Pro Image Modellnamen (auch „Nano Banana Pro“)
Erfordert den Blaze-Tarif (Pay as you go) unabhängig von Ihrem Gemini API-Anbieter.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3-pro-image-preview |
Vorschauversion von Gemini 3 Pro Image (auch „Nano Banana Pro“) |
Vorschau | 2025-11-20 | Noch nicht bekannt |
Gemini 2.5 Pro Modellnamen
Für nicht ist der Blaze-Tarif (Pay as you go) erforderlich, wenn Sie die Gemini Developer API verwenden.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-pro |
Stabile Version von Gemini 2.5 Pro | Stabil | 2025-06-17 | Frühestens am 17.06.2026 |
Gemini 2.5 Flash Modellnamen
Für nicht ist der Blaze-Tarif (Pay as you go) erforderlich, wenn Sie die Gemini Developer API verwenden.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash |
Stabile Version von Gemini 2.5 Flash | Stabil | 2025-06-17 | Frühestens am 17.06.2026 |
Gemini 2.5 Flash‑Lite Modellnamen
Für nicht ist der Blaze-Tarif (Pay as you go) erforderlich, wenn Sie die Gemini Developer API verwenden.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Stabile Version von Gemini 2.5 Flash‑Lite | Stabil | 2025-07-22 | Frühestens am 2026-07-22 |
Gemini 2.5 Flash Image Modellnamen (auch „Nano Banana“ genannt)
Erfordert den Blaze-Tarif (Pay as you go) unabhängig von Ihrem Gemini API-Anbieter.
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash-image |
Stabile Version für Gemini 2.5 Flash Image (auch „Nano Banana“) | Stabil | 2025-10-02 | Frühestens am 2026-10-02 |
Gemini 2.5 Flash Live Modellnamen
Nicht erforderlich, wenn Sie den „Pay as you go“-Tarif „Blaze“ verwenden und Gemini Developer API nutzen (für Vorschaumodelle ist in der Regel ein kostenpflichtiger Tarif erforderlich).
Gemini 2.5 Flash Live-Modelle sind die nativen Audiomodelle, die Gemini Live API unterstützen. Das Modell hat zwar je nach Gemini-API-Anbieter unterschiedliche Modellnamen, das Verhalten und die Funktionen des Modells sind jedoch gleich.
| Gemini Developer API Modellname |
Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 |
Aktuelle Vorschauversion für das Live API auf dem Gemini Developer API | Vorschau | 2025-12-12 | Noch nicht bekannt |
gemini-2.5-flash-native-audio-preview-09-2025 1 |
Erste Vorschauversion für Live API auf dem Gemini Developer API | Vorschau | 2025-09-18 | Noch nicht bekannt |
| Vertex AI Gemini API Modellname |
Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 |
Stabile Version für das Live API auf dem Vertex AI Gemini API | Stabil | 2025-12-12 | Frühestens am 2026-12-12 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 |
Vorschauversion für Live API auf Vertex AI Gemini API | Vorschau | 2025-09-18 | Noch nicht bekannt |
1 Nur vom Gemini Developer API unterstützt.
Obwohl es sich um Vorabmodelle handelt, sind sie im Gemini Developer API im Rahmen des kostenlosen Kontingents verfügbar.
2 Nur von Vertex AI Gemini API unterstützt.
Außerdem werden diese Modelle am Standort global nicht unterstützt.
Imagen Modellnamen
Beispiele für die Initialisierung für Ihre Plattform finden Sie im Leitfaden zum Generieren von Bildern mit Imagen.
Weitere Informationen zu den Release-Phasen (insbesondere zu Anwendungsfällen, Abrechnung und Einstellung) finden Sie unter Versionsverwaltung und Benennungsmuster für Modelle.
Imagen 4 Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Stabile Version von Imagen 4 | Stabil | 2025-08-14 | Frühestens am 14.08.2026 |
Imagen 4 Fast Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Stabile Version von Imagen 4 Fast | Stabil | 2025-08-14 | Frühestens am 14.08.2026 |
Imagen 4 Ultra Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Stabile Version von Imagen 4 Ultra | Stabil | 2025-08-14 | Frühestens am 14.08.2026 |
Imagen 3 Capability Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
imagen-3.0-capability-001 2 |
Erste stabile Version von Imagen 3 Capability | Stabil | 2024-12-10 | Frühestens am 10. Dezember 2025 |
2 Wird von Gemini Developer API nicht unterstützt, unabhängig davon, wie Sie darauf zugreifen.
Unterstützte Sprachen
Gemini
Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:
Arabisch (ar), Bengalisch (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Deutsch (de), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no) ), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi).
Die Modelle Gemini 2.0 Flash, Gemini 1.5 Pro und Gemini 1.5 Flash können die folgenden zusätzlichen Sprachen verstehen und in diesen Sprachen antworten:
Afrikaans (af), Amharisch (am), Assamesisch (as), Aserbaidschanisch (az), Weißrussisch (be), Bosnisch (bs), Katalanisch (ca), Cebuano (ceb), Korsisch (co), Walisisch (cy), Divehi (dv), Esperanto (eo), Baskisch (eu), Persisch (fa), Filipino (Tagalog) (fil), Friesisch (fy), Irisch (ga), Schottisch-Gälisch (gd), Galicisch (gl), Gujarati (gu), Hausa (ha), Hawaiianisch (haw), Hmong (hmn), Haitianisch-Kreolisch (ht), Armenisch (hy), Igbo (ig), Isländisch (is), Javanisch (jv), Georgisch (ka), Kasachisch (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Lateinisch (la), Luxemburgisch (lb), Laotisch (lo), Malagasy (mg), Maori (mi), Mazedonisch (mk), Malayalam (ml), Mongolisch (mn), Meitei (Manipuri) (mni-Mtei), Marathi (mr), Malaysisch (ms), Maltesisch (mt), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Paschtu (ps), Sindhi (sd), Sinhala (Singhalesisch) (si), Samoanisch (sm), Shona (sn), Somali (so), Albanisch (sq), Sesotho (st), Sundanesisch (su), Tamil (ta), Telugu (te), Tadschikisch (tg), Uigurisch (ug), Urdu (ur), Usbekisch (uz), Xhosa (xh), Jiddisch (yi), Yoruba (yo), Zulu (zu)
Imagen
Allgemeine Verfügbarkeit: Englisch
Vorschau: Chinesisch (vereinfacht), Chinesisch (traditionell), Hindi, Japanisch, Koreanisch, Portugiesisch, Spanisch
Informationen zu früheren Modellen
Die folgenden Modelle sind aktiv, gehören aber zur vorherigen Generation. Wir empfehlen, nach Möglichkeit eines der neuesten Modelle zu verwenden.
Gemini Modelle
gemini-2.0-flash-001(und der automatisch aktualisierte Aliasgemini-2.0-flash)gemini-2.0-flash-lite-001(und der automatisch aktualisierte Aliasgemini-2.0-flash-lite)
Informationen zu älteren Gemini Live API-Modellen finden Sie in der Dokumentation des Gemini API-Anbieters:
Imagen Modelle
imagen-3.0-generate-002imagen-3.0-fast-generate-001
Nächste Schritte
Funktionen von Gemini API ausprobieren
- Wechselseitige Unterhaltungen (Chat) erstellen
- Text aus reinen Text-Prompts generieren.
- Sie können Text generieren, indem Sie Prompts mit verschiedenen Dateitypen wie Bildern, PDFs, Videos und Audiodateien verwenden.
- Strukturierte Ausgabe (z. B. JSON) aus Text- und multimodalen Prompts generieren.
- Bilder aus Text-Prompts generieren (Gemini oder Imagen).
- Stream-Ein- und -Ausgabe (einschließlich Audio) mit Gemini Live API.
- Verwenden Sie Tools wie Funktionsaufrufe und Fundierung mit der Google Suche, um ein Gemini-Modell mit anderen Teilen Ihrer App sowie mit externen Systemen und Informationen zu verbinden.