Mit den Firebase AI Logic-SDKs für mobile Apps und Web-Apps können Sie direkt aus Ihrer App mit den unterstützten Gemini-Modellen und Imagen-Modellen interagieren.
Gemini-Modelle gelten als multimodal, da sie in der Lage sind, mehrere Modalitäten zu verarbeiten und sogar zu generieren, darunter Text, Code, PDFs, Bilder, Videos und Audio. Imagen-Modelle können mit Text-Prompts aufgefordert werden, Bilder zu generieren.
Lesen Sie auch unsere FAQs zu allen Modellen, die von Firebase AI Logic unterstützt werden und nicht unterstützt werden.
Modelle für die allgemeine Verwendung
Gemini 3 Pro
gemini-3-pro-preview
Unser bestes Modell für multimodales Verständnis und unser bisher leistungsstärkstes Modell für die Erstellung von Agents und die Vibe-Codierung. Es liefert reichhaltigere Bilder und eine tiefere Interaktivität, die auf modernsten Schlussfolgerungen basiert. (Abrechnung erforderlich)
Gemini 2.5 Pro
gemini-2.5-pro
Unser hochmodernes Denkmodell kann komplexe Probleme in den Bereichen Programmieren, Mathematik und Naturwissenschaften, Technik, Ingenieurwesen und Mathematik (STEM) lösen und große Datasets, Codebasen und Dokumente mit langem Kontext analysieren.
Gemini 2.5 Flash
gemini-2.5-flash
Unser bestes Modell in Bezug auf das Preis-Leistungs-Verhältnis mit umfassenden Funktionen. 2.5 Flash eignet sich am besten für die Verarbeitung im großen Maßstab, Aufgaben mit niedriger Latenz und hohem Volumen, die Denkprozesse erfordern, sowie für agentenbasierte Anwendungsfälle.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Unser schnellstes Flash-Modell, optimiert für Kosteneffizienz und hohen Durchsatz.
Modelle zur Bildgenerierung
Sie können Bilder mit den Modellen Gemini oder Imagen generieren.
Gemini
Gemini 3 Pro Image (auch bekannt als nano banana pro)
gemini-3-pro-image-preview
Für die professionelle Asset-Produktion und komplexe Anweisungen entwickelt. Sie bietet eine realistische Grundlage durch Google Suche, einen standardmäßigen „Denkprozess“, der die Komposition vor der Generierung verfeinert, und kann Bilder mit einer Auflösung von bis zu 4K generieren. (Abrechnung erforderlich)
Gemini 2.5 Flash Image (auch bekannt als Nano-Banana)
gemini-2.5-flash-image
Für Geschwindigkeit und Effizienz entwickelt. Es ist für Aufgaben mit hohem Volumen und geringer Latenz optimiert und generiert Bilder mit einer Auflösung von 1.024 Pixeln. (Abrechnung erforderlich)
Imagen
Imagen 4
imagen-4.0-generate-001
Generiert realistische, hochwertige Bilder aus Text-Prompts in natürlicher Sprache. (Abrechnung erforderlich)
Imagen 4 Fast
imagen-4.0-fast-generate-001
Generiert Bilder für Prototypen oder Anwendungsfälle mit niedriger Latenz. (Abrechnung erforderlich)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
Generiert realistische, hochwertige Bilder aus Text-Prompts in natürlicher Sprache. (Abrechnung erforderlich)
Modelle der vorherigen Generation
Die folgenden Modelle sind aktiv, gehören aber zur vorherigen Generation. Wir empfehlen, nach Möglichkeit eines der neuesten Modelle zu verwenden.
Gemini-Modelle
Gemini 2.0 Flash
gemini-2.0-flash-001
Unser Modell der zweiten Generation mit einem Kontextfenster von 1 Million Tokens. Bietet Funktionen der nächsten Generation und verbesserte Funktionen, darunter eine höhere Geschwindigkeit und die native Nutzung von Tools.
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Unser kleines Arbeitsmodell der zweiten Generation mit einem Kontextfenster von 1 Million Tokens. Optimiert für Kosteneffizienz und niedrige Latenz.
Auf dem Rest dieser Seite finden Sie detaillierte Informationen zu den von Firebase AI Logic unterstützten Modellen.
-
- Unterstützte Ein- und Ausgaben
- Vergleich der unterstützten Funktionen
- Spezifikationen und Einschränkungen, z. B. maximale Anzahl von Eingabetokens oder maximale Länge des Eingabevideos
Beschreibung der Versionsverwaltung von Modellen, insbesondere der Versionen stabil, automatisch aktualisiert, Vorschau und experimentell
Listen der verfügbaren Modellnamen, die bei der Initialisierung in Ihren Code aufgenommen werden sollen.
Listen der unterstützten Sprachen für die Modelle
Unten auf dieser Seite finden Sie detaillierte Informationen zu Modellen der vorherigen Generation.
Modelle vergleichen
Jedes Modell hat unterschiedliche Funktionen für verschiedene Anwendungsfälle. In den Tabellen in diesem Abschnitt wird jedes Modell in Kombination mit Firebase AI Logic beschrieben. Jedes Modell kann zusätzliche Funktionen haben, die bei Verwendung unserer SDKs nicht verfügbar sind.
Wenn Sie die gewünschten Informationen in den folgenden Unterabschnitten nicht finden, können Sie noch mehr Informationen in der Dokumentation des von Ihnen ausgewählten API-Anbieters finden:
Gemini Developer API: Gemini-Modelle und Imagen-Modelle
Vertex AI Gemini API: Gemini-Modelle und Imagen-Modelle
Unterstützte Ein- und Ausgaben
Dies sind die unterstützten Ein- und Ausgabetypen bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (generieren) | Imagen (Funktion) | |
|---|---|---|---|---|---|---|---|
| Eingabetypen | |||||||
| Text | |||||||
| Text (Streaming) | |||||||
| Code | |||||||
| Dokumente (PDFs oder Nur-Text) |
|||||||
| Bilder | |||||||
| Video | |||||||
| Audio | |||||||
| Audio (Streaming) | |||||||
| Ausgabetypen | |||||||
| Text | |||||||
| Text (Streaming) | |||||||
| Code | |||||||
| Strukturierte Ausgabe (z. B. JSON) |
|||||||
| Bilder | |||||||
| Audio | |||||||
| Audio (Streaming) | |||||||
Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Eingabedateien und Anforderungen.
Unterstützte Funktionen
Das sind die unterstützten Funktionen und Features bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (generieren) | Imagen (Funktion) | |
|---|---|---|---|---|---|---|---|
| Denken | |||||||
| Text generieren aus Nur-Text- oder multimodalen Eingaben | verschachtelt oder als Teil des Bildes | verschachtelt oder als Teil des Bildes | Nur Streaming | ||||
|
Bilder generieren (Gemini oder Imagen) |
|||||||
|
Bilder bearbeiten (Gemini oder Imagen) |
|||||||
| Audio generieren | Nur Streaming | ||||||
|
Strukturierte Ausgabe generieren
(z. B. JSON) |
|||||||
|
Dokumente analysieren
(PDFs oder Nur-Text) |
|||||||
| Bilder analysieren (Vision) | |||||||
| Video analysieren (Vision) | |||||||
| Audio analysieren | Nur Streaming | ||||||
| Wechselseitiger Chat | |||||||
| Bidirektionales multimodales Streaming | |||||||
| Funktionsaufrufe | |||||||
| Codeausführung | |||||||
| Fundierung mit der Google Suche | |||||||
| Systemanweisungen | |||||||
| Tokens zählen |
Spezifikationen und Einschränkungen
Hier finden Sie die Spezifikationen und Einschränkungen für die Verwendung der einzelnen Modelle mit Firebase AI Logic:
| Attribut |
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (generieren) | Imagen (Funktion) |
|---|---|---|---|---|---|---|---|
| Eingabetokenlimit * | 1.048.576 Tokens | 65.536 Tokens | 1.048.576 Tokens | 32.768 Tokens | 32.768 Tokens | 480 Tokens | 480 Tokens |
| Tokenausgabelimit* | 65.536 Tokens | 32.768 Tokens | 65.536 Tokens | 8.192 Tokens | 8.192 Tokens | --- | --- |
| Wissensstichtag | Januar 2025 | Januar 2025 | Januar 2025 | Juni 2025 | August 2024 | --- | --- |
| PDFs (auf Anfrage) | |||||||
| Maximale Anzahl von PDF-Eingabedateien ** |
900 Dateien | 14 Dateien | 3.000 Dateien | 3 Dateien | --- | --- | --- |
| Maximale Anzahl von Seiten pro PDF-Eingabedatei** |
900 Seiten | 14 Seiten | 1.000 Seiten | 3 Seiten | --- | --- | --- |
| Maximale Größe pro PDF-Eingabedatei |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | --- |
| Bilder (pro Anfrage) | |||||||
| Maximale Anzahl von Eingabebildern |
1.000 Bilder | 14 Bilder | 3.000 Bilder | 3 Bilder | --- | --- | 4 Bilder |
| Maximale Anzahl von Ausgabebildern |
--- | 10 Bilder | --- | 10 Bilder | --- | 4 Bilder | 4 Bilder |
| Maximale Größe pro base64-codiertem Eingabebild |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | --- |
| Video (auf Anfrage) | |||||||
| Maximale Anzahl von Eingabevideodateien |
10 Dateien | --- | 10 Dateien | --- | --- | --- | --- |
| Maximale Länge aller Eingabevideos (nur Frames) |
~ 60 Minuten | --- | ~ 60 Minuten | --- | --- | --- | --- |
| Maximale Länge aller Eingabevideos (Bilder + Audio) |
ca. 45 Minuten | --- | ca. 45 Minuten | --- | --- | --- | --- |
| Audio (pro Anfrage) | |||||||
| Maximale Anzahl von Eingabe-Audiodateien |
1 Datei | --- | 1 Datei | --- | --- | --- | --- |
| Maximale Anzahl von Ausgabe-Audiodateien |
--- | --- | --- | --- | --- | --- | --- |
| Maximale Länge aller Eingabe-Audiodateien |
ca.8,4 Stunden | --- | ca.8,4 Stunden | --- | --- | --- | --- |
| Maximale Länge aller Ausgabe-Audiodateien |
--- | --- | --- | --- | --- | --- | --- |
*
Bei allen Gemini-Modellen entspricht ein Token etwa vier Zeichen. 100 Tokens entsprechen also etwa 60–80 englischen Wörtern. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens ermitteln.
** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.
Weitere detaillierte Informationen finden
Kontingente und Preise sind für jedes Modell unterschiedlich. Die Preise hängen auch von der Eingabe und Ausgabe ab.
Informationen zu unterstützten Eingabedateitypen, zum Angeben des MIME-Typs und dazu, wie Sie dafür sorgen, dass Ihre Eingabedateien und multimodalen Anfragen den Anforderungen entsprechen und die Best Practices in Unterstützte Eingabedateien und Anforderungen eingehalten werden.
Modellversionsverwaltung und Namensmuster
Modelle werden in stabilen, Vorschau- und experimentellen Versionen angeboten. Zur Vereinfachung werden Aliase ohne explizite Versionswerte unterstützt.
Informationen dazu, wie Sie bestimmte Modellnamen für Ihren Code finden, finden Sie weiter unten auf dieser Seite im Abschnitt Verfügbare Modellnamen.
| Versionstyp / Releasestufe |
Beschreibung | Muster für Modellnamen | |
|---|---|---|---|
| Stabil |
Stabile Versionen sind ab dem Veröffentlichungsdatum für die Produktion verfügbar und werden unterstützt.
|
|
|
| Automatisch aktualisierter stabiler Alias (nur Gemini 2.0-Modelle) |
Automatisch aktualisierte stabile Aliase verweisen immer auf die neueste stabile Version des jeweiligen Modells.
|
Nur Gemini 2.0-Modelle
Beispiel: |
|
| Vorschau |
Vorschauversionen haben neue Funktionen und gelten als nicht stabil.
|
An die Modellnamen von Vorschauversionen wird
Beispiele: |
|
| Experimentell |
Experimentelle Versionen haben neue Funktionen und gelten als nicht stabil.
|
An die Modellnamen von experimentellen Versionen wird
Beispiel: |
|
| Rentner |
Eingestellte Versionen sind nach dem Einstellungsdatum endgültig deaktiviert.
|
--- |
|
Verfügbare Modellnamen
Modellnamen sind die expliziten Werte, die Sie in Ihren Code bei der Initialisierung des Modells einfügen.
Zu Gemini-Modellnamen springen Zu Imagen-Modellnamen springen
Alle verfügbaren Modelle programmatisch auflisten
Sie können alle verfügbaren Modellnamen mit der REST API auflisten:
Gemini Developer API: Rufe den Endpunkt
models.listauf.Vertex AI Gemini API: Rufe den Endpunkt
publishers.models.listauf.
Die zurückgegebene Liste enthält alle von den API-Anbietern unterstützten Modelle. Firebase AI Logic unterstützt jedoch nur die auf dieser Seite beschriebenen Modelle Gemini und Imagen.
Automatisch aktualisierte Aliase (z. B. gemini-2.0-flash) werden nicht aufgeführt, da sie ein Alias für das Basismodell sind.
Gemini Modellnamen
Beispiele für die Initialisierung für Ihre Plattform finden Sie im Startleitfaden.
Weitere Informationen zu den Release-Phasen (insbesondere zu Anwendungsfällen, Abrechnung und Einstellung) finden Sie unter Versionsverwaltung und Benennungsmuster für Modelle.
Gemini 3 Pro Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3-pro-preview |
Vorschauversion von Gemini 3 Pro | Vorschau | 2025-11-18 | Noch nicht bekannt |
Gemini 3 Pro Image-Modellnamen (auch „Nano Banana Pro“)
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-3-pro-image-preview |
Vorschauversion von Gemini 3 Pro Image | Vorschau | 2025-11-20 | Noch nicht bekannt |
Gemini 2.5 Pro Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-pro |
Stabile Version von Gemini 2.5 Pro | Stabil | 2025-06-17 | Frühestens am 17.06.2026 |
Gemini 2.5 Flash Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash |
Stabile Version von Gemini 2.5 Flash | Stabil | 2025-06-17 | Frühestens am 17.06.2026 |
Gemini 2.5 Flash‑Lite Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Stabile Version von Gemini 2.5 Flash‑Lite | Stabil | 2025-07-22 | Frühestens am 2026-07-22 |
Gemini 2.5 Flash Image Modellnamen (auch „Nano Banana“ genannt)
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.5-flash-image |
Stabile Version für Gemini 2.5 Flash Image (auch „Nano Banana“) | Stabil | 2025-10-02 | Frühestens am 2026-10-02 |
Gemini 2.5 Flash Live Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-live-2.5-flash |
Stabile Version für Gemini 2.5 Flash Live | Stabil (privater GA-Release) 1 |
2025-06-01 | Frühestens am 01.06.2026 |
gemini-live-2.5-flash-preview 2 |
Vorschauversion für Gemini 2.5 Flash Live | Vorschau | 2025-06-01 | Noch nicht bekannt |
Firebase AI Logic unterstützt die nativen Audiomodelle (z. B. gemini-2.5-flash-native-audio-preview-09-2025) noch nicht.
1 Wenden Sie sich an Ihren Google Cloud-Kontoteamvertreter, um Zugriff anzufordern. 2 Wird von der Vertex AI Gemini API nicht unterstützt, unabhängig davon, wie Sie darauf zugreifen.
Gemini 2.0 Flash Live Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
gemini-2.0-flash-live-001 2 |
Stabile Version für Gemini 2.0 Flash Live | Stabil | 2025-04-01 | Frühestens am 01.04.2026 |
gemini-2.0-flash-live-preview-04-09 |
Vorschauversion für Gemini 2.0 Flash Live | Vorschau | 2025-04-09 | Noch nicht bekannt |
2 Wird von Vertex AI Gemini API nicht unterstützt, unabhängig davon, wie Sie darauf zugreifen.
Imagen Modellnamen
Beispiele für die Initialisierung für Ihre Plattform finden Sie im Leitfaden zum Generieren von Bildern mit Imagen.
Weitere Informationen zu den Release-Phasen (insbesondere zu Anwendungsfällen, Abrechnung und Einstellung) finden Sie unter Versionsverwaltung und Benennungsmuster für Modelle.
Imagen 4 Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Stabile Version von Imagen 4 | Stabil | 2025-08-14 | Frühestens am 14.08.2026 |
Imagen 4 Fast Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Stabile Version von Imagen 4 Fast | Stabil | 2025-08-14 | Frühestens am 14.08.2026 |
Imagen 4 Ultra Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Stabile Version von Imagen 4 Ultra | Stabil | 2025-08-14 | Frühestens am 14.08.2026 |
Imagen 3 Capability Modellnamen
| Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
|---|---|---|---|---|
imagen-3.0-capability-001 3 |
Erste stabile Version von Imagen 3 Capability | Stabil | 2024-12-10 | Frühestens am 10. Dezember 2025 |
3 Wird von Gemini Developer API nicht unterstützt, unabhängig davon, wie Sie darauf zugreifen.
Unterstützte Sprachen
Gemini
Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:
Arabisch (ar), Bengalisch (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Deutsch (de), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no) ), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi).
Die Modelle Gemini 2.0 Flash, Gemini 1.5 Pro und Gemini 1.5 Flash können die folgenden zusätzlichen Sprachen verstehen und darauf antworten:
Afrikaans (af), Amharisch (am), Assamesisch (as), Aserbaidschanisch (az), Weißrussisch (be), Bosnisch (bs), Katalanisch (ca), Cebuano (ceb), Korsisch (co), Walisisch (cy), Divehi (dv), Esperanto (eo), Baskisch (eu), Persisch (fa), Filipino (Tagalog) (fil), Friesisch (fy), Irisch (ga), Schottisch-Gälisch (gd), Galicisch (gl), Gujarati (gu), Hausa (ha), Hawaiianisch (haw), Hmong (hmn), Haitianisch-Kreolisch (ht), Armenisch (hy), Igbo (ig), Isländisch (is), Javanisch (jv), Georgisch (ka), Kasachisch (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Lateinisch (la), Luxemburgisch (lb), Laotisch (lo), Malagasy (mg), Maori (mi), Mazedonisch (mk), Malayalam (ml), Mongolisch (mn), Meitei (Manipuri) (mni-Mtei), Marathi (mr), Malaysisch (ms), Maltesisch (mt), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Paschtu (ps), Sindhi (sd), Sinhala (Singhalesisch) (si), Samoanisch (sm), Shona (sn), Somali (so), Albanisch (sq), Sesotho (st), Sundanesisch (su), Tamil (ta), Telugu (te), Tadschikisch (tg), Uigurisch (ug), Urdu (ur), Usbekisch (uz), Xhosa (xh), Jiddisch (yi), Yoruba (yo), Zulu (zu)
Imagen
Allgemeine Verfügbarkeit: Englisch
Vorschau: Chinesisch (vereinfacht), Chinesisch (traditionell), Hindi, Japanisch, Koreanisch, Portugiesisch, Spanisch
Informationen zu früheren Modellen
Die folgenden Modelle sind aktiv, gehören aber zur vorherigen Generation. Wir empfehlen, nach Möglichkeit eines der neuesten Modelle zu verwenden.
Gemini Modelle
| Modell | Eingabe | Ausgabe | Beschreibung |
|---|---|---|---|
Gemini 2.0 Flashgemini-2.0-flash-001
|
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Unser multimodales Modell mit Funktionen der nächsten Generation und verbesserten Funktionen, einschließlich hervorragender Geschwindigkeit, integrierter Tool-Nutzung und einem Kontextfenster von 1 Million Tokens |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Unser schnellstes und kostengünstigstes Flash-Modell. Es ist ein Upgrade für 1.5 Flash-Nutzer, die für denselben Preis und dieselbe Geschwindigkeit eine bessere Qualität wünschen. |
Imagen Modelle
| Modell | Eingabe | Ausgabe | Beschreibung |
|---|---|---|---|
Imagen 3imagen-3.0-generate-002 |
Text | Bilder | Generiert realistische, hochwertige Bilder aus Text-Prompts in natürlicher Sprache |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
Text | Bilder | Generiert Bilder für Prototypen oder Anwendungsfälle mit niedriger Latenz |
2 Wird von Gemini Developer API nicht unterstützt, unabhängig davon, wie Sie darauf zugreifen.
Nächste Schritte
Funktionen von Gemini API ausprobieren
- Wechselseitige Unterhaltungen (Chat) erstellen
- Text aus reinen Text-Prompts generieren.
- Sie können Text generieren, indem Sie Prompts mit verschiedenen Dateitypen wie Bildern, PDFs, Videos und Audiodateien verwenden.
- Strukturierte Ausgabe (z. B. JSON) aus Text- und multimodalen Prompts generieren.
- Bilder aus Text-Prompts generieren (Gemini oder Imagen).
- Stream-Ein- und -Ausgabe (einschließlich Audio) mit Gemini Live API.
- Verwenden Sie Tools wie Funktionsaufrufe und Fundierung mit der Google Suche, um ein Gemini-Modell mit anderen Teilen Ihrer App sowie mit externen Systemen und Informationen zu verbinden.