Informacje o obsługiwanych modelach

W przypadku aplikacji mobilnych i internetowych pakiety SDK Vertex AI in Firebase umożliwiają interakcję z obsługiwanymi modelami GeminiImagen 3 bezpośrednio z aplikacji.

Modele Gemini są uważane za multimodalne, ponieważ potrafią przetwarzać i nawet generować różne rodzaje danych, w tym tekst, kod, pliki PDF, obrazy, filmy i dźwięk. Modele Imagen 3 mogą generować obrazy na podstawie tekstu.

W tabeli poniżej znajdziesz krótki przegląd obsługiwanych modeli Vertex AI in Firebase oraz ich najnowszych stabilnych nazw. Tabela zawiera też modele w wersji zapoznawczej i eksperymentalnej, które są dostępne do tworzenia prototypów.

Model Dane wejściowe Wyniki Opis
Gemini modeli ze stabilnymi wersjami
Gemini 2.0 Flash
gemini-2.0-flash-001
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON
(wkrótce: obrazy i dźwięk)
Zapewnia funkcje nowej generacji i szybkość wykonywania różnych zadań
(wkrótce udostępnimy generowanie multimodalne)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON Zapewnia wydajność z niskim opóźnieniem przy niskich kosztach; obsługuje wysoką przepustowość
Gemini modele z tylko wersjami podglądu i eksperymentalnymi (zalecane tylko do tworzenia prototypów)
Gemini 2.5 Pro
gemini-2.5-pro-exp-03-25
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON Oferuje zaawansowane rozumowanie, zwłaszcza w zakresie wielomodalnego rozumienia, kodowania i wiedzy o świecie.
Gemini 2.0 Flash‑Thinking
gemini-2.0-flash-thinking-exp-01-21
tekst, kod, pliki PDF, obrazy tekst, kod, JSON oferuje lepsze możliwości rozumowania i zawiera w odpowiedziach proces myślowy;
Imagen 3 modeli (w przypadku korzystania z Vertex AI in Firebase)
Imagen 3
imagen-3.0-generate-002
tekst obrazy generuje realistyczne, wysokiej jakości obrazy na podstawie promptów tekstowych w języku naturalnym;
Imagen 3 Fast
imagen-3.0-fast-generate-001
tekst obrazy generuje obrazy do prototypowania lub zastosowań wymagających niskiego opóźnienia;

Tak, Vertex AI in Firebase obsługuje wszystkie modele Gemini, w tym starsze.

Model Dane wejściowe Wyniki Zoptymalizowany dla
Gemini 1.5 Pro
gemini-1.5-pro-002
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON Obsługuje złożone zadania wymagające większej inteligencji; 2 mln tokenów w kontekście
Gemini 1.5 Flash
gemini-1.5-flash-002
tekst, kod, pliki PDF, obrazy, filmy, dźwięk tekst, kod, JSON Zapewnia szybką i wszechstronną wydajność w wielu różnych zadaniach
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
tekst, kod, pliki PDF, obrazy, film (tylko ramki) tekst, kod Obsługuje tekst, obrazy i filmy w przypadku odpowiedzi tekstowych lub kodowych. Nie można ich używać do czatu.
Gemini 1.0 Pro
gemini-1.0-pro-002
tekst, kod tekst, kod zadania dotyczące języka naturalnego, czaty tekstowe i z kodem w wielu etapach oraz generowanie kodu;

Vertex AI in Firebase obsługuje tylko modele Imagen 3. Nie obsługuje on starszych modeli Imagen (takich jak Imagen 2).

U dołu tej strony możesz wyświetlić szczegółowe informacje o starszych modelach. Zapoznaj się z często zadawanymi pytaniami dotyczącymi wszystkich modeli obsługiwanych i nieobsługiwanych przez Vertex AI in Firebase.


W pozostałej części tej strony znajdziesz szczegółowe informacje o modelach obsługiwanych przez Vertex AI in Firebase:

  • Porównaj modele:

    • Obsługiwane urządzenia wejściowe i wyjściowe
    • Ogólne porównanie obsługiwanych funkcji
    • Specyfikacje i ograniczenia, np. maksymalna liczba tokenów wejściowych lub maksymalna długość filmu wejściowego
  • Opis wersji modeli, w szczególności ich wersji stabilnej, automatycznie aktualizowanejpodglądu.

  • listy dostępnych nazw modeli do uwzględnienia w kodzie podczas inicjalizacji;

  • listy obsługiwanych języków dla modeli;

U dołu tej strony możesz wyświetlić szczegółowe informacje o starszych modelach.



Porównanie modeli

Każdy model ma inne możliwości, które umożliwiają obsługę różnych przypadków użycia. Pamiętaj, że każda tabela w tej sekcji opisuje poszczególne modele w połączeniu z funkcją Vertex AI in Firebase. Każdy model może mieć dodatkowe funkcje, które nie są dostępne podczas korzystania z naszych pakietów SDK.

Jeśli nie możesz znaleźć potrzebnych informacji w podrozdziałach poniżej, więcej informacji o modelach GeminiImagen 3 znajdziesz w dokumentacji Google Cloud.

Obsługiwane urządzenia wejściowe i wyjściowe

Oto obsługiwane typy danych wejściowych i wyjściowych w przypadku każdego modelu z użyciem funkcji Vertex AI in Firebase:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Typy danych wejściowych
Tekst
Kod
Dokumenty
(pliki PDF lub tekstowe)
Obrazy
Wideo
Audio
Dźwięk (strumieniowanie) wkrótce
Typy danych wyjściowych
Tekst
Kod
Dane wyjściowe w uporządkowanym formacie
(np. JSON)
Obrazy wkrótce
Audio wkrótce
Dźwięk (strumieniowanie) wkrótce

Informacje o obsługiwanych typach plików znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania dotyczące usługi Vertex AI Gemini API.

Obsługiwane funkcje i możliwości

Te funkcje są obsługiwane podczas korzystania z każdego modelu z użyciem Vertex AI in Firebase:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
Imagen 3 /
Imagen 3 Fast
generowanie tekstu na podstawie danych tekstowych lub multimodalnych,
Generowanie obrazów
(Imagen 3)
wkrótce
Generowanie dźwięku wkrótce
Generowanie uporządkowanych danych wyjściowych
(np. w formacie JSON)
analizować dokumenty
(pliki PDF lub tekstowe).
analizowanie obrazów (systemy wizyjne);
Analiza wideo(wizja)
Analiza dźwięku
Czat wieloetapowy
Połączenia z funkcjami (narzędzia)
Licznik tokenów i znaków podlegających rozliczeniu
Instrukcje dotyczące systemu
Interfejs multimodalny Live API
(transmisja dwukierunkowa)
wkrótce

Specyfikacje i ograniczenia

Oto specyfikacje i ograniczenia każdego modelu w przypadku parametru Vertex AI in Firebase:

Właściwość <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Thinking </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Okno kontekstu *
Łączny limit tokenów
(łączna liczba tokenów wejściowych i wyjściowych)
2 097 152 tokeny 1 048 576 tokenów 1 048 576 tokenów 1 048 576 tokenów 480 tokenów
Limit tokenów wyjściowych * 64 tys. tokenów 8192 tokenów 8192 tokenów 8192 tokenów ---
Data odcięcia Styczeń 2025 r. Czerwiec 2024 r. Czerwiec 2024 r. Czerwiec 2024 r. ---
pliki PDF (na żądanie),
Maksymalna liczba
pobranych plików PDF **
3000 plików 3000 plików 3000 plików 3000 plików ---
Maksymalna liczba
stron
na plik PDF wejściowy **
1000 stron 1000 stron 1000 stron 1000 stron ---
Maksymalny rozmiar
na plik PDF wejściowy
50 MB 50 MB 50 MB 50 MB ---
Obrazy (na żądanie)
Maksymalna liczba
obrazów
3000 obrazów 3000 obrazów 3000 obrazów 3000 obrazów ---
Maksymalna liczba
obrazów
--- wkrótce --- --- 4 obrazy
Maksymalny rozmiar
na obraz zakodowany w formacie base64
7 MB 7 MB 7 MB 7 MB ---
Film (na żądanie)
Maksymalna liczba
wejściowych plików wideo
10 plików 10 plików 10 plików --- ---
Maksymalna długość
wszystkich filmów wejściowych
(tylko ramki)
ok. 60 minut ok. 60 minut ok. 60 minut --- ---
Maksymalna długość
wszystkich filmów wejściowych
(ramki + dźwięk)
ok. 45 minut ok. 45 minut ok. 45 minut --- ---
Dźwięk (z uwzględnieniem żądań)
Maksymalna liczba
plików audio
1 plik 1 plik 1 plik --- ---
Maksymalna liczba
pliku wyjściowego
--- wkrótce --- --- ---
Maksymalna długość
wszystkich wejść audio
ok.8,4 godziny ok.8,4 godziny ok.8,4 godziny --- ---
Maksymalna długość
wszystkich dźwięków wyjściowych
--- wkrótce --- --- ---

*W przypadku wszystkich modeli Gemini jeden token odpowiada około 4 znakom, a 100 tokenów to około 60–80 słów w języku angielskim. W przypadku modeli Gemini możesz określić łączną liczbę tokenów w żądaniach za pomocą parametru countTokens.

** Pliki PDF są traktowane jako obrazy, więc pojedyncza strona pliku PDF jest traktowana jako jeden obraz. Liczba stron dozwolonych w żądaniu jest ograniczona do liczby obrazów, które może obsługiwać model.

Znajdowanie dodatkowych szczegółowych informacji



Wzorce obsługi wersji i nazywania modeli

Modele są dostępne w wersjach stabilnej, testowejeksperymentalnej. Dla wygody obsługiwane są aliasy bez dokładnych wartości wersji.

Aby znaleźć konkretne nazwy modeli do użycia w kodzie, zapoznaj się z sekcją „dostępne nazwy modeli” dalej na tej stronie.

Typ wersji Opis Wzorzec nazwy modelu
Stabilna Stabilne wersje są uważane za ogólnie dostępne.

nazwy modeli stabilnych wersji są uzupełniane o specyficzny 3-cyfrowy numer wersji.

Przykład: gemini-2.0-flash-001
Przykład: imagen-3.0-generate-002

Stały alias aktualizowany automatycznie Automatycznie aktualizowane aliasy wersji stabilnych zawsze wskazują najnowszą wersję stabilną danego modelu. Jeśli zostanie opublikowana nowa wersja stabilna, alias automatycznie aktualizowany automatycznie zacznie wskazywać nową wersję stabilną.

Nazwa modelu aliasu nie zawiera żadnych elementów dodatkowych.

Przykład: gemini-2.0-flash

Podgląd Wersje w obejściu mają nowe możliwości i są uważane za niestabilne.

Wersje podglądu zawsze odnoszą się do najnowszej wersji tego modelu. Jeśli zostanie opublikowana nowa wersja podglądu, wszystkie istniejące wersje podglądu będą automatycznie wskazywać nową wersję podglądu.

Nazwy modeli wersji podglądowych są uzupełniane o ciąg znaków -preview oraz datę początkową wydania modelu (-MMDD).

Przykład: gemini-2.0-flash-lite-preview-02-05
(wydana 5 lutego 2025 r.)

eksperymentalna, Wersje eksperymentalne mają nowe funkcje i są uważane za niestabilne. Nie są one zgodne ze standardowym planem cyklu życia modelu i schematem wersji Google.

Dowiedz się więcej o modelach eksperymentalnych.

Nazwy modeli wersji eksperymentalnych są uzupełniane o parametr -exp oraz datę ich pierwszego wydania (-MMDD).

Przykład: gemini-2.5-pro-exp-03-25
(wydana 25 marca 2025 r.)

Więcej informacji o dostępnych wersjach modelu i ich cyklu życia (Gemini) lub Imagen znajdziesz w dokumentacji Google Cloud.



Dostępne nazwy modeli

Nazwy modeli to wartości jawne, które uwzględniasz w kodzie podczas inicjalizacji modelu.

Aby wyświetlić listę wszystkich dostępnych nazw modeli, możesz użyć punktu końcowego publishers.models.list. Zwróć uwagę, że zwrócona lista będzie zawierać wszystkie modele obsługiwane przez Vertex AI, ale Vertex AI in Firebase obsługuje tylko modele GeminiImagen opisane na tej stronie. Pamiętaj też, że aliasy aktualizowane automatycznie (np. gemini-2.0-flash) nie są wyświetlane, ponieważ są to aliasy ułatwiające korzystanie z modelu podstawowego.

Gemini nazwy modeli

Przykłady inicjalizowania w danym języku znajdziesz w przewodniku dla początkujących.

Gemini 2.5 Pro nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
Brak dostępnych wersji stabilnych --- --- --- ---
Stały alias aktualizowany automatycznie
Nie ma dostępnego stabilnego aliasu z automatyczną aktualizacją --- --- --- ---
Wersje podglądu
Brak wersji podglądu --- --- --- ---
Wersje eksperymentalne
gemini-2.5-pro-exp-03-25 Eksperymentalna wersja Gemini 2.5 Pro Wersja eksperymentalna 2025-03-25 Jeszcze nieznany

Gemini 2.0 Pro nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
Brak dostępnych wersji stabilnych --- --- --- ---
Stały alias aktualizowany automatycznie
Nie ma dostępnego stabilnego aliasu z automatyczną aktualizacją --- --- --- ---
Wersje podglądu
Brak wersji podglądu --- --- --- ---
Wersje eksperymentalne
Zastąpiony przez: gemini-2.5-pro-exp-03-25 Wersja eksperymentalna dla modeli Gemini Pro Wersja eksperymentalna 2025-03-25 Jeszcze nieznany

Gemini 2.0 Flash nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
gemini-2.0-flash-001 najnowsza stabilna wersja aplikacji Gemini 2.0 Flash, Ogólna dostępność 2025-02-05 Nie wcześniej niż
2026-02-05
Stały alias aktualizowany automatycznie
gemini-2.0-flash Wskazuje na najnowszą stabilną wersję modelu 2.0 Flash
(obecnie gemini-2.0-flash-001)
Ogólna dostępność 2025-02-10 ---
Wersje podglądu
Brak wersji podglądu --- --- --- ---
Wersje eksperymentalne
Brak dostępnych wersji eksperymentalnych --- --- --- ---

Gemini 2.0 Flash‑Lite nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
gemini-2.0-flash-lite-001 najnowsza stabilna wersja aplikacji Gemini 2.0 Flash‑Lite, Ogólna dostępność 2025-02-25 Nie wcześniej niż
2026-02-25
Stały alias aktualizowany automatycznie
gemini-2.0-flash-lite Wskazuje na najnowszą stabilną wersję 2.0 Flash-Lite
(obecnie gemini-2.0-flash-lite-001)
Ogólna dostępność 2025-02-25 ---
Wersje podglądu
Brak wersji podglądu --- --- --- ---
Wersje eksperymentalne
Brak dostępnych wersji eksperymentalnych --- --- --- ---

Gemini 2.0 Flash‑Thinking nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
Brak dostępnych wersji stabilnych --- --- --- ---
Stały alias aktualizowany automatycznie
Nie ma dostępnego stabilnego aliasu z automatyczną aktualizacją --- --- --- ---
Wersje podglądu
Brak wersji podglądu --- --- --- ---
Wersje eksperymentalne
gemini-2.0-flash-thinking-exp-01-21 Eksperymentalna wersja Gemini 2.0 Flash‑Thinking Wersja eksperymentalna 2025-01-21 Jeszcze nieznany

Imagen nazwy modeli

Przykłady inicjalizacji w przypadku Twojego języka znajdziesz w przewodniku generowania obrazów za pomocą Imagen.

Obecnie żaden z modeli Imagen 3 nie ma wersji wstępnej ani eksperymentalnej.

Imagen 3 nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
imagen-3.0-generate-002 najnowsza stabilna wersja aplikacji Imagen 3, Ogólna dostępność 2025-01-23 Nie wcześniej niż 23.01.2026
imagen-3.0-generate-001 Pierwsza stabilna wersja Imagen 3 Ogólna dostępność 2024-07-31 Nie wcześniej niż 31.07.2025

Imagen 3 Fast nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
imagen-3.0-fast-generate-001 Pierwsza stabilna wersja Imagen 3 Fast Ogólna dostępność 2024-07-31 Nie wcześniej niż 31.07.2025



Obsługiwane języki

Gemini

  • Wszystkie modele Gemini rozumieją i odpowiadają w tych językach:

    arabski (ar), bengalski (bn), bułgarski (bg), chiński uproszczony i tradycyjny (zh), chorwacki (hr), czeski (cs), duński (da), niderlandzki (nl), angielski (en), estoński (et), fiński (fi), francuski (fr), grecki (el), hebrajski (iw), hindi (hi), węgierski (hu), indonezyjski (id), hiszpański (es), japoński (ja), koreański (ko), łaciński (la), litewski (lt), norweski (no), polski (pl), portugalski (pt), rumuński (ro), rosyjski (ru), serbski (sr), słowacki (sk), słoweński (sl), szwedzki (sv), swahili (sw), tajski (th), turecki (tr), ukraiński (uk), wietnamski (vi)

  • Modele Gemini 2.0 Flash, Gemini 1.5 ProGemini 1.5 Flash rozumieją i odpowiadają w tych dodatkowych językach:

    Afrikaans (af), amharski (am), assamski (as), azerski (az), białoruski (be), bośniacki (bs), kataloński (ca), cebuańska (ceb), korsykański (co), walijski (cy), divehi (dv), esperanto (eo), baskijski (eu), perski (fa), filipino (tagalog) (fil), fryzyjski (fy), irlandzki (ga), szkocki gaelicki (gd), galicyjski (gl), gudżarati (gu), hausa (ha), hawajski (haw), hmong (hmn), kreolski haitamski (ht), ormiański (hy), igbokańska (ig), islandzki (is), jawajski (jv), gruziński (ka), kazachski (kk), khmerski (km), kannada (kn), krio (kri), kurdyjski (ku), kirgiski (ky), łacina (la), birmański (my), nepalski (ne), nyanja (Chichewa) (ny), orija (Oriya) (or), pendżabski (pa), paszto (ps), sindhi (sd), sinhala (sinhalese) (si), samoański (sm), shona (sn), somali (so), albański (sq), sesotho (st), tamilski (ta), telugu (te), tadżycki (tg), ujgurski (ug), urdu (ur), uzbecki (uz), xhosa (xh), jidysz (yi), joruba (yo), zulu (zu)

Imagen

  • Ogólna dostępność: angielski

  • Podgląd: chiński (uproszczony), chiński (tradycyjny), hindi, japoński, koreański, portugalski, hiszpański



Informacje o starszych modelach

Vertex AI in Firebase obsługuje wszystkie modele Gemini, w tym starsze modele, takie jak Gemini 1.5Gemini 1.0.

Vertex AI in Firebase obsługuje tylko modele Imagen 3. Nie obsługuje on starszych modeli Imagen (takich jak Imagen 2).

Oto typy danych wejściowych i wyjściowych w przypadku każdego modelu z użyciem funkcji Vertex AI in Firebase:

<span="notranslate">Gemini 1.5 Pro </span="notranslate"> <span="notranslate">Gemini 1.5 Flash </span="notranslate"> <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> <span="notranslate">Gemini 1.0 Pro </span="notranslate">
Typy danych wejściowych
Tekst
Kod
Dokumenty
(pliki PDF lub tekstowe)
Obrazy
Wideo
Audio
Dźwięk (strumieniowanie)
Typy danych wyjściowych
Tekst
Kod
Dane wyjściowe w uporządkowanym formacie
(np. JSON)
obrazy, filmy i pliki audio;

Oto możliwości i funkcje dostępne podczas korzystania z każdego modelu z użyciem Vertex AI in Firebase:

<span="notranslate">Gemini 1.5 Pro </span="notranslate"> <span="notranslate">Gemini 1.5 Flash </span="notranslate"> <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> <span="notranslate">Gemini 1.0 Pro </span="notranslate">
Generowanie tekstu na podstawie tylko tekstu
Generowanie tekstu na podstawie danych multimodalnych
Generuj obrazy
Generowanie dźwięku
Generowanie uporządkowanych danych wyjściowych
(np. w formacie JSON)
analizować dokumenty
(pliki PDF lub tekstowe).
analizowanie obrazów (systemy wizyjne);
Analiza wideo(wizja)
Analiza dźwięku
Czat wieloetapowy
Połączenia z funkcjami (narzędzia)
Licznik tokenów i znaków podlegających rozliczeniu
Instrukcje dotyczące systemu
Interfejs multimodalny Live API
(transmisja dwukierunkowa)

Oto specyfikacje i ograniczenia każdego modelu w przypadku parametru Vertex AI in Firebase:

<span="notranslate">Gemini 1.5 Pro </span="notranslate"> <span="notranslate">Gemini 1.5 Flash </span="notranslate"> <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> <span="notranslate">Gemini 1.0 Pro </span="notranslate">
Okno kontekstu *
Łączny limit tokenów
(łączna liczba tokenów wejściowych i wyjściowych)
2 097 152 tokeny 1 048 576 tokenów 16 384 tokenów 32 760 tokenów
Limit tokenów wyjściowych * 8192 tokenów 8192 tokenów 2048 tokenów 8192 tokenów
Data odcięcia Maj 2024 r. Maj 2024 r. Luty 2023 r. Luty 2023 r.
pliki PDF (na żądanie),
Maksymalna liczba
pobranych plików PDF **
3000 plików 3000 plików 16 plików ---
Maksymalna liczba
stron na plik PDF wejściowy **
1000 stron 1000 stron 16 stron ---
Maksymalny rozmiar
na plik PDF wejściowy
50 MB 50 MB 50 MB ---
Obrazy (na żądanie)
Maksymalna liczba
obrazów
3000 obrazów 3000 obrazów 16 obrazów ---
Maksymalna liczba
obrazów
--- --- --- ---
Maksymalny rozmiar
na obraz zakodowany w formacie base64
7 MB 7 MB 7 MB ---
Film (na żądanie)
Maksymalna liczba
wejściowych plików wideo
10 plików 10 plików 1 plik ---
Maksymalna długość
wszystkich filmów wejściowych
(tylko ramki)
ok. 60 minut ok. 60 minut 2 minuty ---
Maksymalna długość
wszystkich filmów wejściowych
(ramki + dźwięk)
ok. 45 minut ok. 45 minut --- ---
Dźwięk (z uwzględnieniem żądań)
Maksymalna liczba
plików audio
1 plik 1 plik --- ---
Maksymalna liczba
pliku wyjściowego
--- --- --- ---
Maksymalna długość
wszystkich wejść audio
ok.8,4 godziny ok.8,4 godziny --- ---
Maksymalna długość
wszystkich dźwięków wyjściowych
--- --- --- ---

*W przypadku wszystkich modeli Gemini jeden token odpowiada około 4 znakom, a 100 tokenów to około 60–80 słów w języku angielskim. W przypadku modeli Gemini możesz określić łączną liczbę tokenów w żądaniach za pomocą parametru countTokens.

** Pliki PDF są traktowane jako obrazy, więc pojedyncza strona pliku PDF jest traktowana jako jeden obraz. Liczba stron dozwolonych w żądaniu jest ograniczona do liczby obrazów, które może obsługiwać model.

Dostępne nazwy starszych modeli (w tym daty zakończenia sprzedaży)

Nazwy modeli to wartości jawne, które uwzględniasz w kodzie podczas inicjalizacji modelu.

Nazwy modeli Gemini 1.5 Pro

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
gemini-1.5-pro-002 najnowsza stabilna wersja aplikacji Gemini 1.5 Pro, Wycofano 2024-09-24 2025-09-24
gemini-1.5-pro-001 Pierwsza stabilna wersja Gemini 1.5 Pro Wycofano 2024-05-24 2025-05-24
Stały alias aktualizowany automatycznie
gemini-1.5-pro wskazuje najnowszą stabilną wersję 1.5 Pro
(obecnie gemini-1.5-pro-002).
Wycofano 2024-09-24 2025-09-24

Gemini 1.5 Flash nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
gemini-1.5-flash-002 najnowsza stabilna wersja aplikacji Gemini 1.5 Flash, Wycofano 2024-09-24 2025-09-24
gemini-1.5-flash-001 Pierwsza stabilna wersja Gemini 1.5 Flash Wycofano 2024-05-24 2025-05-24
Stały alias aktualizowany automatycznie
gemini-1.5-flash Wskazuje najnowszą stabilną wersję Flasha 1.5
(obecnie gemini-1.5-flash-002)
Wycofano 2024-09-24 2025-09-24

Gemini 1.0 Pro Vision nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
gemini-1.0-pro-vision-001 najnowsza stabilna wersja aplikacji Gemini 1.0 Pro Vision, Wycofano 2024-02-15 2025-04-21
Stały alias aktualizowany automatycznie
gemini-1.0-pro-vision Wskazuje najnowszą stabilną wersję 1.5 Pro Vision
(obecnie gemini-1.5-pro-vision-001).
Wycofano 2024-01-04 2025-04-21

Gemini 1.0 Pro nazwy modeli

Nazwa modelu Opis Etap udostępniania Data pierwszego wydania Data zaprzestania
Wersje stabilne
gemini-1.0-pro-002 najnowsza stabilna wersja aplikacji Gemini 1.0 Pro, Wycofano 2024-04-09 2025-04-21
gemini-1.0-pro-001 Stabilna wersja Gemini 1.0 Pro Wycofano 2024-02-15 2025-04-21
Stały alias aktualizowany automatycznie
gemini-1.0-pro Wskazuje najnowszą stabilną wersję 1.0 Pro
(obecnie gemini-1.0-pro-002).
Wycofano 2024-02-15 2025-04-21



Dalsze kroki

Wypróbuj możliwości Gemini API