W przypadku aplikacji mobilnych i internetowych pakiety SDK Firebase AI Logic umożliwiają interakcję z obsługiwanymi Gemini modelami bezpośrednio z aplikacji.
Modele Gemini są uważane za wielomodalne, ponieważ potrafią przetwarzać, a nawet generować różne typy treści, w tym tekst, kod, pliki PDF, obrazy, filmy i dźwięk.
Zapoznaj się też z naszymi najczęstszymi pytaniami dotyczącymi wszystkich modeli, które Firebase AI Logic obsługuje i których nie obsługuje.
Modele ogólnego zastosowania
Gemini 3.1 Pro
gemini-3.1-pro-preview
Zaawansowana inteligencja, umiejętności rozwiązywania złożonych problemów i zaawansowane możliwości kodowania agentów i stylu.
Gemini 3 Flash
gemini-3-flash-preview
Wydajność klasy Frontier porównywalna z większymi modelami przy ułamku kosztów.
Gemini 3.1 Flash-Lite
gemini-3.1-flash-lite-preview
Wydajny model do zadań wymagających dużych nakładów pracy i wrażliwych na koszty, który zapewnia wydajność i jakość serii Gemini 3.
Gemini 2.5 Pro
gemini-2.5-pro
Nasz najbardziej zaawansowany model z serii Gemini 2.5 do złożonych zadań, który charakteryzuje się zaawansowanymi możliwościami rozumowania i kodowania.
Gemini 2.5 Flash
gemini-2.5-flash
Nasz najlepszy model z serii Gemini 2.5 pod względem stosunku ceny do wydajności, szczególnie w przypadku zadań wymagających rozumowania, które charakteryzują się krótkim czasem oczekiwania i dużą liczbą zapytań.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Najszybszy i najbardziej przystępny cenowo model multimodalny z serii Gemini 2.5.
Modele generujące obrazy
Możesz generować i edytować obrazy za pomocą modeli Gemini.
Gemini
Gemini 3 Pro Image (Nano Banana Pro)
gemini-3-pro-image-preview
zaprojektowany do profesjonalnego tworzenia komponentów, wykorzystujący zaawansowane rozumowanie („myślenie”) w celu wykonywania złożonych instrukcji i renderowania tekstu o wysokiej jakości.
Gemini 3.1 Flash Image (Nano Banana 2)
gemini-3.1-flash-image-preview
Wysokowydajny odpowiednik modelu Gemini 3 Pro Image, zoptymalizowany pod kątem szybkości i dużej liczby przypadków użycia przez deweloperów.
Gemini 2.5 Flash Image (Nano Banana)
gemini-2.5-flash-image
Zaprojektowane z myślą o szybkości i wydajności, zoptymalizowane pod kątem zadań o dużej skali i małych opóźnieniach.
Imagen (wycofany)
Więcej informacji o modelach Imagen znajdziesz w sekcji Starsze modele Imagen poniżej.
Modele generujące dźwięk
Możesz generować strumieniowy dźwięk za pomocą modeli, które obsługują Gemini Live API.
Gemini 2.5 Flash z natywnym dźwiękiem interfejsu Gemini Live API
Gemini Developer API: gemini-2.5-flash-native-audio-preview-12-2025
Vertex AI Gemini API: gemini-live-2.5-flash-native-audio
Umożliwia interakcje głosowe i wideo w czasie rzeczywistym z niewielkimi opóźnieniami przy użyciu modelu Gemini, który jest dwukierunkowy.
W dalszej części tej strony znajdziesz szczegółowe informacje o modelach obsługiwanych przez Firebase AI Logic.
-
- Obsługiwane wejścia i wyjścia
- Ogólne porównanie obsługiwanych funkcji
- Specyfikacje i ograniczenia, np. maksymalna liczba tokenów wejściowych lub maksymalna długość filmu wejściowego
Opis wersjonowania modeli, a w szczególności ich wersji stabilnych, aktualizowanych automatycznie, wersji testowych i eksperymentalnych.
Listy dostępnych nazw modeli, które można uwzględnić w kodzie podczas inicjowania.
Listy obsługiwanych języków w przypadku modeli
U dołu tej strony możesz wyświetlić szczegółowe informacje o modelach poprzedniej generacji.
Porównanie modeli
Każdy model ma inne możliwości, które pozwalają obsługiwać różne przypadki użycia. Pamiętaj, że każda tabela w tej sekcji opisuje poszczególne modele w przypadku użycia z Firebase AI Logic. Każdy model może mieć dodatkowe możliwości, które nie są dostępne podczas korzystania z naszych pakietów SDK.
Jeśli nie możesz znaleźć potrzebnych informacji w poniższych podsekcjach, więcej informacji znajdziesz w dokumentacji wybranego dostawcy interfejsu API:Gemini Developer API lub Vertex AI Gemini API.
Obsługiwane wejścia i wyjścia
Oto obsługiwane typy danych wejściowych i wyjściowychw przypadku używania poszczególnych modeli z Firebase AI Logic:
|
<span="notranslate">Gemini 3 i 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 i 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Typy danych wejściowych | |||||
| Tekst | (streaming) | ||||
| Kod | |||||
| Dokumenty (pliki PDF lub zwykły tekst) |
|||||
| Obrazy | |||||
| Wideo | (streaming) | ||||
| Dźwięk | (streaming) | ||||
| Typy danych wyjściowych | |||||
| Tekst | |||||
| Tekst (strumieniowanie) | (transkrypcja) | ||||
| Kod | |||||
| Uporządkowane dane wyjściowe (np. JSON) |
|||||
| Obrazy | |||||
| Dźwięk | (streaming) | ||||
Więcej informacji o obsługiwanych typach plików znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania.
Obsługiwane funkcje
Oto obsługiwane funkcje i możliwości w przypadku korzystania z poszczególnych modeli z Firebase AI Logic:
|
<span="notranslate">Gemini 3 i 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 i 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Myślenie | |||||
| Generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst lub danych multimodalnych | przeplatane lub jako część obrazu | przeplatane lub jako część obrazu | tylko transkrypcja, | ||
| Generowanie obrazów | |||||
| Edytowanie obrazów | |||||
| Wygeneruj dźwięk | tylko streaming | ||||
|
Generowanie
danych wyjściowych w formacie strukturalnym
(np. JSON) |
|||||
|
Analizowanie dokumentów
(pliki PDF lub zwykły tekst) |
|||||
| Analizowanie obrazów (widzenie) | |||||
| Analizowanie filmu (widzenie) | tylko streaming | ||||
| Analizowanie dźwięku | tylko streaming | ||||
| Czat wieloetapowy | tylko streaming | ||||
| Dwukierunkowe przesyłanie strumieniowe multimodalne | |||||
| Instrukcje systemowe | |||||
| Licz tokeny |
Obsługiwane narzędzia
Oto obsługiwane narzędzia, gdy używasz każdego modelu z Firebase AI Logic:|
<span="notranslate">Gemini 3 i 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 i 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|
|---|---|---|---|---|---|
| Wywoływanie funkcji | |||||
| Wykonanie kodu | |||||
| Kontekst adresu URL | |||||
| Grounding z użyciem wyszukiwarki Google |
Specyfikacje i ograniczenia
Oto specyfikacje i ograniczenia dotyczące korzystania z poszczególnych modeli z parametrem Firebase AI Logic:
| Właściwość |
<span="notranslate">Gemini 3 i 3.1 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 3 i 3.1 Pro, Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash‑Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash‑Live *** </span="notranslate"> |
|---|---|---|---|---|---|
| Limit tokenów wejściowych* | 1 048 576 tokenów | 65 536 tokenów | 1 048 576 tokenów | 32 768 tokenów | 32 tys. tokenów (domyślnie; można zwiększyć do 128 tys. tokenów) |
| Limit tokenów wyjściowych* | 65 536 tokenów | 32 768 tokenów | 65 536 tokenów | 8192 tokeny | 64 tys. tokenów |
| Data graniczna wiedzy | Styczeń 2025 r. | Styczeń 2025 r. | Styczeń 2025 r. | Czerwiec 2025 r. | Styczeń 2025 r. |
| Pliki PDF (na żądanie) | |||||
| Maksymalna liczba wejściowych plików PDF ** |
900 plików | 14 plików | 3000 plików | 3 pliki | --- |
| Maksymalna liczba stron w pliku PDF ** |
900 stron | 14 stron | 1000 stron | 3 strony | --- |
| Maksymalny rozmiar pliku PDF wejściowego |
50 MB | 50 MB | 50 MB | 50 MB | --- |
| Grafika (z uwzględnieniem żądań) | |||||
| Maksymalna liczba obrazów wejściowych |
1000 obrazów | 14 obrazów | 3000 obrazów | 3 obrazy | --- |
| Maksymalna liczba obrazów wyjściowych |
--- | 10 obrazów | --- | 10 obrazów | --- |
| Maksymalny rozmiar na wejściowy obraz zakodowany w formacie base64 |
7 MB | 7 MB | 7 MB | 7 MB | --- |
| Wideo (z uwzględnieniem żądań) | |||||
| Maksymalna liczba plików wideo wejściowych |
10 plików | --- | 10 plików | --- | --- |
| Maksymalna długość wszystkich filmów wejściowych (tylko klatki) |
~60 minut | --- | ~60 minut | --- | --- |
| Maksymalna długość wszystkich filmów wejściowych (klatki + dźwięk) |
~45 minut | --- | ~45 minut | --- | --- |
| Dźwięk (z uwzględnieniem żądań) | |||||
| Maksymalna liczba wejściowych plików audio |
1 plik | --- | 1 plik | --- | --- |
| Maksymalna liczba wyjściowych plików audio |
--- | --- | --- | --- | --- |
| Maksymalna długość wszystkich wejściowych plików audio |
Ok.8,4 godziny | --- | Ok.8,4 godziny | --- | --- |
| Maksymalna długość wszystkich wyjściowych plików audio |
--- | --- | --- | --- | --- |
*
W przypadku wszystkich modeli Gemini token odpowiada około 4 znakom, więc 100 tokenów to około 60–80 słów w języku angielskim. W przypadku modeli Gemini możesz określić łączną liczbę tokenów w żądaniach za pomocą countTokens.
** Pliki PDF są traktowane jako obrazy, więc jedna strona pliku PDF jest traktowana jako jeden obraz. Liczba stron dozwolonych w żądaniu jest ograniczona do liczby obrazów, które może obsługiwać model.
*** Modele Gemini 2.5 Flash-Live to natywne modele audio, które obsługują Gemini Live API.
Znajdowanie dodatkowych szczegółowych informacji
Limity i ceny są różne w przypadku poszczególnych modeli. Ceny zależą też od danych wejściowych i wyjściowych.
Więcej informacji o obsługiwanych typach plików wejściowych, sposobie określania typu MIME oraz o tym, jak zadbać o to, aby pliki wejściowe i żądania multimodalne spełniały wymagania i były zgodne ze sprawdzonymi metodami, znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania.
Wersjonowanie modeli i wzorce nazewnictwa
Modele są dostępne w wersjach stabilnej, testowej i eksperymentalnej. Dla wygody obsługiwane są aliasy bez jawnych wartości wersji.
Aby znaleźć konkretne nazwy modeli do użycia w kodzie, zapoznaj się z sekcją „Dostępne nazwy modeli” poniżej.
| Typ wersji / Etap publikacji |
Opis | Wzorzec nazwy modelu | |
|---|---|---|---|
| Stabilna |
Stabilne wersje są dostępne i obsługiwane
do użytku produkcyjnego od daty premiery.
|
|
|
| Automatycznie aktualizowany alias wersji stabilnej (tylko modele Gemini 2.0) |
Automatycznie aktualizowane stabilne aliasy zawsze wskazują najnowszą stabilną wersję danego modelu.
|
Gemini 2.0 tylko modele
Przykład: |
|
| Podgląd |
Wersje przedpremierowe mają nowe funkcje i są uważane za niestabilne.
|
Nazwy modeli w wersji testowej mają dopisek
Przykłady: |
|
| Eksperymentalne |
Wersje eksperymentalne mają nowe funkcje i są uważane za niestabilne.
|
Nazwy modeli wersji eksperymentalnych są uzupełniane o
Przykład: |
|
| Jestem na emeryturze |
Wersje wycofane są po dacie wycofania i zostały trwale wyłączone.
|
--- |
|
Dostępne nazwy modeli
Nazwy modeli to konkretne wartości, które umieszczasz w kodzie podczas inicjowania modelu.
Przejdź do Gemini nazw modeli Przejdź do Imagen nazw modeli (wycofane)
Programowe wyświetlanie listy wszystkich dostępnych modeli
Za pomocą interfejsu API REST możesz wyświetlić listę wszystkich dostępnych nazw modeli:
Gemini Developer API: wywołaj
models.listpunkt końcowyVertex AI Gemini API: wywołaj
publishers.models.listpunkt końcowy
Pamiętaj, że zwrócona lista będzie zawierać wszystkie modele obsługiwane przez dostawców interfejsów API, ale Firebase AI Logic obsługuje tylko modele Gemini i Imagen opisane na tej stronie.
Pamiętaj też, że automatycznie aktualizowane aliasy (np. gemini-2.0-flash) nie są wymienione, ponieważ są aliasami ułatwiającymi korzystanie z modelu podstawowego.
Gemini nazwy modeli
Przykłady inicjowania na Twojej platformie znajdziesz w przewodniku dla początkujących.
Szczegółowe informacje o etapach udostępniania (zwłaszcza przypadki użycia, rozliczenia i wyłączanie) znajdziesz w artykule Wersje modeli i wzorce nazewnictwa.
Gemini 3.1 Pro nazwy modeli
Wymaga abonamentu Blaze (płatność według wykorzystania) niezależnie od dostawcy Gemini API.
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-3.1-pro-preview |
Najnowsza wersja podglądowa Gemini 3 Pro | Podgląd | 2026-02-19 | Jeszcze nieznany |
Gemini 3 Flash nazwy modeli
Nie wymaga planu cenowego Blaze z płatnością według wykorzystania, jeśli korzystasz z Gemini Developer API (zwykle modele w wersji podglądowej wymagają płatnego planu).
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-3-flash-preview |
Wersja podglądu: Gemini 3 Flash | Podgląd | 2025-12-17 | Jeszcze nieznany |
Gemini 3.1 Flash‑Lite nazwy modeli
Nie wymaga planu cenowego Blaze z płatnością według wykorzystania, jeśli korzystasz z Gemini Developer API (zwykle modele w wersji podglądowej wymagają płatnego planu).
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-3.1-flash-lite-preview |
Wersja podglądu: Gemini 3.1 Flash‑Lite | Podgląd | 2026-03-03 | Jeszcze nieznany |
Nazwy modeli Gemini 3 Pro Image (czyli „Nano Banana Pro”)
Wymaga abonamentu Blaze (płatność według wykorzystania) niezależnie od dostawcy Gemini API.
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-3-pro-image-preview |
Wersja podglądowa Gemini 3 Pro Image (znana też jako „Nano Banana Pro”) |
Podgląd | 2025-11-20 | Jeszcze nieznany |
Nazwy modeli Gemini 3.1 Flash Image (czyli „Nano Banana 2”)
Wymaga abonamentu Blaze (płatność według wykorzystania) niezależnie od dostawcy Gemini API.
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-3.1-flash-image-preview |
Wersja podglądowa Gemini 3.1 Flash Image (znana też jako „Nano Banana 2”) |
Podgląd | 2026-02-26 | Jeszcze nieznany |
Gemini 2.5 Pro nazwy modeli
Niewymaga abonamentu Blaze (płatność według wykorzystania), jeśli używasz Gemini Developer API.
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-2.5-pro |
Stabilna wersja Gemini 2.5 Pro | Stabilny | 2025-06-17 | Nie wcześniej niż 17 czerwca 2026 r. |
Gemini 2.5 Flash nazwy modeli
Niewymaga abonamentu Blaze (płatność według wykorzystania), jeśli używasz Gemini Developer API.
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-2.5-flash |
Stabilna wersja Gemini 2.5 Flash | Stabilny | 2025-06-17 | Nie wcześniej niż 17 czerwca 2026 r. |
Gemini 2.5 Flash‑Lite nazwy modeli
Niewymaga abonamentu Blaze (płatność według wykorzystania), jeśli używasz Gemini Developer API.
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Stabilna wersja Gemini 2.5 Flash‑Lite | Stabilny | 2025-07-22 | Nie wcześniej niż 22 lipca 2026 r. |
Nazwy modeli Gemini 2.5 Flash Image (czyli „Nano Banana”)
Wymaga abonamentu Blaze (płatność według wykorzystania) niezależnie od dostawcy Gemini API.
| Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-2.5-flash-image |
Wersja stabilna dla Gemini 2.5 Flash Image (znana też jako „Nano Banana”) | Stabilny | 2025-10-02 | Nie wcześniej niż 2026-10-02 |
Gemini 2.5 Flash Live nazwy modeli
Nie wymaga planu cenowego Blaze z płatnością według wykorzystania, jeśli korzystasz z Gemini Developer API (zwykle modele w wersji podglądowej wymagają płatnego planu).
Gemini 2.5 Flash Live to modele natywnego dźwięku, które obsługują Gemini Live API. Mimo że model ma różne nazwy w zależności od dostawcy interfejsu API Gemini, jego działanie i funkcje są takie same.
| Gemini Developer API Nazwa modelu |
Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 |
Najnowsza wersja podglądowa Live API na Gemini Developer API | Podgląd | 2025-12-12 | Jeszcze nieznany |
gemini-2.5-flash-native-audio-preview-09-2025 1 |
Wstępna wersja podglądu Live API na Gemini Developer API | Podgląd | 2025-09-18 | Jeszcze nieznany |
| Vertex AI Gemini API Nazwa modelu |
Opis | Etap udostępniania | Data premiery | Data wyłączenia |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 |
Wersja stabilna Live API na Vertex AI Gemini API | Stabilny | 2025-12-12 | Nie wcześniej niż 12 grudnia 2026 r. |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 |
Wersja podglądowa Live API na Vertex AI Gemini API | Podgląd | 2025-09-18 | Jeszcze nieznany |
1 Obsługiwane tylko przez Gemini Developer API.
Chociaż są to modele w wersji podglądowej, są one dostępne w ramach „bezpłatnej wersji” Gemini Developer API.
2 Tylko obsługiwane przez Vertex AI Gemini API.
Te modele nie są też obsługiwane w lokalizacji global.
Imagen nazwy modeli (wycofane)
Nazwy modeli Imagen znajdziesz w sekcji Starsze modele Imagen poniżej.
Obsługiwane języki
Wszystkie modele Gemini rozumieją te języki i mogą w nich odpowiadać:
angielski (en), arabski (ar), bengalski (bn), bułgarski (bg), chiński (uproszczony i tradycyjny) (zh), chorwacki (hr), czeski (cs), duński (da), estoński (et), fiński (fi), francuski (fr), grecki (el), hebrajski (iw), hindi (hi), hiszpański (es), indonezyjski (id), japoński (ja), koreański (ko), litewski (lt), łotewski (lv), niderlandzki (nl), niemiecki (de), norweski (no), polski (pl), portugalski (pt), rosyjski (ru), rumuński (ro), serbski (sr), słowacki (sk), słoweński (sl), suahili (sw), szwedzki (sv), tajski (th), turecki (tr), ukraiński (uk), węgierski (hu), wietnamski (vi), włoski (it).
Modele Gemini 2.0 Flash, Gemini 1.5 Pro i Gemini 1.5 Flash rozumieją i odpowiadają w tych dodatkowych językach:
afrikaans (af), amharski (am), asamski (as), azerbejdżański (az), białoruski (be), bośniacki (bs), kataloński (ca), cebuański (ceb), korsykański (co), walijski (cy), malediwski (dv), esperanto (eo), baskijski (eu), perski (fa), filipiński (tagalski) (fil), fryzyjski (fy), irlandzki (ga), szkocki gaelicki (gd), galicyjski (gl), gudżarati (gu), hausa (ha), hawajski (haw), hmong (hmn), kreolski haitański (ht), ormiański (hy), igbo (ig), islandzki (is), jawajski (jv), gruziński (ka), kazachski (kk), khmerski (km), kannada (kn), krio (kri), kurdyjski (ku), kirgiski (ky), łaciński (la), luksemburski (lb), laotański (lo), malgaski (mg), maoryski (mi), macedoński (mk), malajalam (ml), mongolski (mn), meitei (manipuri) (mni-Mtei), marathi (mr), malajski (ms), maltański (mt), birmański (my), nepalski (ne), nyanja (chichewa) (ny), odia (or), pendżabski (pa), paszto (ps), sindhi (sd), syngaleski (si), samoański (sm), shona (sn), somalijski (so), albański (sq), sotho (st), sundajski (su), tamilski (ta), telugu (te), tadżycki (tg), ujgurski (ug), urdu (ur), uzbecki (uz), xhosa (xh), jidysz (yi), joruba (yo), zulu (zu)
Informacje o poprzednich modelach
Są one aktywne, ale należą do poprzedniej generacji. W miarę możliwości zalecamy korzystanie z jednego z najnowszych modeli.
Jeśli nie możesz znaleźć potrzebnych informacji w kolejnych podsekcjach, więcej informacji znajdziesz w dokumentacji wybranego dostawcy interfejsu API:
Gemini Developer API:Gemini – modele i Imagen – modele
Vertex AI Gemini API:Gemini – modele i Imagen – modele
Starsze modele Gemini
gemini-2.0-flash-001(i jego automatycznie aktualizowany aliasgemini-2.0-flash).gemini-2.0-flash-lite-001(i jego automatycznie aktualizowany aliasgemini-2.0-flash-lite).
Informacje o starszych modelach Gemini Live API znajdziesz w dokumentacji dostawcy Gemini API:
Starsze modele Imagen
imagen-4.0-ultra-generate-001imagen-4.0-generate-001imagen-4.0-fast-generate-001imagen-3.0-capability-001imagen-3.0-generate-002imagen-3.0-generate-001imagen-3.0-fast-generate-001
Wyświetlanie szczegółów poprzednich modeli
Dalsze kroki
Wypróbuj możliwości Gemini API
- Twórz rozmowy wieloetapowe (czat).
- generować tekst na podstawie promptów zawierających tylko tekst,
- Generuj tekst, podając różne typy plików, takie jak obrazy, pliki PDF, filmy i pliki audio.
- Generowanie danych wyjściowych o strukturze (np. JSON) na podstawie promptów tekstowych i multimodalnych.
- Generowanie i edytowanie obrazów na podstawie promptów tekstowych i multimodalnych.
- Przesyłanie strumieniowe danych wejściowych i wyjściowych (w tym audio) za pomocą Gemini Live API.
- Używaj narzędzi (takich jak wywoływanie funkcji i uzyskiwanie dostępu do informacji z wyszukiwarki Google), aby połączyć model Gemini z innymi częściami aplikacji oraz zewnętrznymi systemami i informacjami.