Mempelajari model yang didukung

Untuk aplikasi seluler dan web, SDK Vertex AI in Firebase memungkinkan Anda berinteraksi dengan model Gemini yang didukung langsung dari aplikasi Anda.

Model Gemini dianggap multimodal karena mampu memproses dan bahkan menghasilkan beberapa modalitas, termasuk teks, kode, PDF, gambar, video, dan audio.

Berikut adalah ringkasan singkat tentang model yang didukung untuk Vertex AI in Firebase dan versi stabil terbarunya. Bagian di halaman ini nanti memberikan perbandingan dan informasi selengkapnya.

Model Input Output Dioptimalkan untuk
Model Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
teks, kode, PDF, gambar, video, audio teks, kode, JSON
(gambar & audio segera hadir!)
Fitur, kecepatan, dan pembuatan multimodal generasi berikutnya untuk berbagai tugas
Gemini 1.5 Pro
gemini-1.5-pro-002
teks, kode, PDF, gambar, video, audio teks, kode, JSON Tugas penalaran kompleks yang memerlukan lebih banyak kecerdasan
Gemini 1.5 Flash
gemini-1.5-flash-002
teks, kode, PDF, gambar, video, audio teks, kode, JSON Performa yang cepat dan serbaguna di berbagai tugas


Bagian lain dari halaman ini memberikan informasi mendetail tentang model yang didukung oleh Vertex AI in Firebase:

Di bagian bawah halaman ini, Anda dapat melihat informasi mendetail tentang model lama.



Membandingkan model

Setiap model memiliki kemampuan yang berbeda untuk mendukung berbagai kasus penggunaan. Perhatikan bahwa setiap tabel di bagian ini menjelaskan setiap model saat digunakan dengan Vertex AI in Firebase. Setiap model mungkin memiliki kemampuan tambahan yang tidak tersedia saat menggunakan SDK kami.

Anda dapat mempelajari lebih lanjut setiap model Gemini dalam dokumentasi Google Cloud.

Input dan output yang didukung

Berikut adalah jenis input dan output yang didukung saat menggunakan setiap model dengan Vertex AI in Firebase:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Jenis input
Teks
Kode
Dokumen (PDF atau teks biasa)
Gambar, Video, dan Audio
Audio (streaming) segera hadir!
Jenis output
Teks
Output terstruktur (seperti JSON)
Kode
Gambar segera hadir!
Audio segera hadir!
Audio (streaming) segera hadir!

Untuk mempelajari jenis file yang didukung, lihat File input dan persyaratan yang didukung untuk Vertex AI Gemini API.

Kemampuan dan fitur yang didukung

Berikut adalah kemampuan dan fitur yang didukung saat menggunakan setiap model dengan Vertex AI in Firebase:

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Membuat teks dari teks atau multimodal input
Buat gambar segera hadir!
Membuat audio segera hadir!
Membuat output terstruktur (seperti JSON)
Menganalisis gambar dan video (visi)
Menganalisis audio
Menganalisis dokumen (PDF atau teks biasa)
Multi-turn chat
Panggilan fungsi (alat)
Panggilan fungsi dasar
Panggilan fungsi paralel
Mode panggilan fungsi
Menghitung token dan karakter yang dapat ditagih
Petunjuk sistem
Multimodal Live API (streaming dua arah) segera hadir!

Spesifikasi dan batasan

Berikut adalah spesifikasi dan batasan saat menggunakan setiap model dengan Vertex AI in Firebase:

Properti Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
Jendela konteks *
Total batas token (input+output gabungan)
1.048.576 token 2.097.152 token 1.048.576 token
Batas token output * 8.192 token 8.192 token 8.192 token
Tanggal batas waktu Knowledge Juni 2024 Mei 2024 Mei 2024
Gambar (per permintaan)
Jumlah maksimum gambar input 3.000 gambar 3.000 gambar 3.000 gambar
Jumlah maksimum gambar output segera hadir! --- ---
Ukuran maksimum per input gambar berenkode base64 7 MB 7 MB 7 MB
PDF (sesuai permintaan)
Jumlah maksimum file PDF input ** 3.000 file 3.000 file 3.000 file
Jumlah maksimum halaman per file PDF input ** 1.000 halaman 1.000 halaman 1.000 halaman
Ukuran maksimum per file PDF input 50 MB 50 MB 50 MB
Video (sesuai permintaan)
Jumlah maksimum file video input 10 file 10 file 10 file
Durasi maksimum semua video input (hanya frame) ~60 menit ~60 menit ~60 menit
Durasi maksimum semua video input (frame+audio) ~45 menit ~45 menit ~45 menit
Audio (sesuai permintaan)
Jumlah maksimum file audio input 1 file 1 file 1 file
Jumlah maksimum file audio output segera hadir! --- ---
Panjang maksimum semua audio input ~8,4 jam ~8,4 jam ~8,4 jam
Panjang maksimum semua audio output segera hadir! --- ---

* Untuk semua model, token setara dengan sekitar 4 karakter, sehingga 100 token setara dengan sekitar 60-80 kata dalam bahasa Inggris. Untuk model Gemini, Anda dapat menentukan jumlah total token dalam permintaan menggunakan countTokens.

** PDF diperlakukan sebagai gambar, sehingga satu halaman PDF diperlakukan sebagai satu gambar. Jumlah halaman yang diizinkan dalam permintaan dibatasi pada jumlah gambar yang dapat didukung model.

Menemukan informasi mendetail tambahan



Pola penamaan dan pembuatan versi model

Model ditawarkan dalam versi stabil, diupdate otomatis, dan pratinjau.

  • Versi Stabil dianggap Tersedia Secara Umum.

    • Versi stabil memiliki nama model yang ditambahkan dengan nomor versi tiga digit tertentu, misalnya gemini-2.0-flash-001 .
  • Versi diupdate otomatis selalu mengarah ke versi stabil terbaru dari model tersebut; jika versi stabil baru dirilis, versi diupdate otomatis akan otomatis mulai mengarah ke versi stabil baru tersebut.

    • Versi yang diperbarui secara otomatis memiliki nama model tanpa akhiran, misalnya gemini-2.0-flash.
  • Versi Pratinjau memiliki kemampuan baru dan dianggap tidak stabil. Perhatikan bahwa versi pratinjau selalu mengarah ke versi pratinjau terbaru dari model tersebut; jika versi pratinjau baru dirilis, versi pratinjau yang ada akan otomatis mulai mengarah ke versi pratinjau baru tersebut.

    • Versi pratinjau memiliki nama model yang ditambahkan dengan -preview beserta tanggal rilis awal model (-MMDD), misalnya gemini-1.5-pro-preview-0409 (dirilis pada 9 April 2024).

Pelajari lebih lanjut versi model yang tersedia dan siklus prosesnya (Gemini) dalam dokumentasi Google Cloud.



Nama model yang tersedia

Nama model adalah nilai eksplisit yang Anda sertakan dalam kode selama inisialisasi model generatif (yang merupakan langkah yang diperlukan untuk memanggil Gemini API).

Anda dapat menggunakan endpoint publishers.models.list untuk mencantumkan semua nama model yang tersedia. Perhatikan bahwa daftar yang ditampilkan ini akan menyertakan semua model yang didukung Vertex AI, tetapi Vertex AI in Firebase hanya mendukung model Gemini yang dijelaskan di halaman ini. Perhatikan juga bahwa versi yang diperbarui secara otomatis (misalnya, gemini-2.0-flash) tidak tercantum karena merupakan alias praktis untuk model stabil dasar.

Nama model Gemini

Untuk contoh inisialisasi bahasa Anda, lihat panduan memulai.

Nama model Gemini 2.0 Flash

Nama model Deskripsi Tahap rilis Tanggal rilis awal Tanggal penghentian
Versi stabil
gemini-2.0-flash-001 Gemini 2.0 Flash versi stabil terbaru Ketersediaan Umum 2025-02-05 Belum ditentukan
Versi yang diupdate otomatis
gemini-2.0-flash Menunjuk ke versi stabil terbaru 2.0 Flash
(saat ini gemini-2.0-flash-001)
Ketersediaan Umum 2025-02-10 ---

Nama model Gemini 1.5 Pro

Nama model Deskripsi Tahap rilis Tanggal rilis awal Tanggal penghentian
Versi stabil
gemini-1.5-pro-002 Gemini 1.5 Pro versi stabil terbaru Ketersediaan Umum 2024-09-24 Tidak lebih awal dari 24-09-2025
gemini-1.5-pro-001 Versi stabil awal Gemini 1.5 Pro Ketersediaan Umum 2024-05-24 Tidak lebih awal dari 24-05-2025
Versi yang diupdate otomatis
gemini-1.5-pro Menunjuk ke versi stabil terbaru 1.5 Pro
(saat ini gemini-1.5-pro-002)
Ketersediaan Umum 2024-09-24 ---

Nama model Gemini 1.5 Flash

Nama model Deskripsi Tahap rilis Tanggal rilis awal Tanggal penghentian
Versi stabil
gemini-1.5-flash-002 Gemini 1.5 Flash versi stabil terbaru Ketersediaan Umum 2024-09-24 Tidak lebih awal dari 24-09-2025
gemini-1.5-flash-001 Versi stabil awal Gemini 1.5 Flash Ketersediaan Umum 2024-05-24 Tidak lebih awal dari 24-05-2025
Versi yang diupdate otomatis
gemini-1.5-flash Menunjuk ke versi stabil terbaru Flash 1.5
(saat ini gemini-1.5-flash-002)
Ketersediaan Umum 2024-09-24 ---



Bahasa yang didukung

Gemini

  • Semua model Gemini dapat memahami dan merespons dalam bahasa berikut:

    Arab (ar), Bengali (bn), Bulgaria (bg), China aksara sederhana dan tradisional (zh), Kroasia (hr), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Jerman (de), Yunani (el), Ibrani (iw), Hindi (hi), Hungaria (hu), Indonesia (id), Italia (it), Jepang (ja), Korea (ko), Latvia (lv), Lituania (lt), Norwegia (no), Polandia (pl), Portugis (pt), Rumania (ro), Rusia (ru), Serbia (sr), Slovakia (sk), Slovenia (sl), Spanyol (es), Swahili (sw), Swedia (sv), Thailand (th), Turkiye (tr), Ukraina (uk), Vietnam (vi)

  • Model Gemini 1.5 Pro dan Gemini 1.5 Flash dapat memahami dan merespons dalam bahasa tambahan berikut:

    Afrikaans (af), Amharik (am), Assam (as), Azerbaijan (az), Belarus (be), Bosnia (bs), Katalan (ca), Cebuano (ceb), Korsika (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persia (fa), Filipina (Tagalog) (fil), Frisia (fy), Irlandia (ga), Gaelik Skotlandia (gd), Galisia (gl), Gujarat (gu), Hausa (ha), Hawaii (haw), Hmong (hmn), Kreol Haiti (ht), Armenia (hy), Igbo (ig), Islandia (is), Jawa (jv), Georgia (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdi (ku), Kirgiz (ky), Latin (la), Luksemburg (lb), Laos (lo), Malagasy (mg), Maori (mi), Makedonia (mk), Malayalam (ml), Mongolia (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Melayu (ms), Malta (mt), Myanmar (Burma) (my), Nepal (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoa (sm), Shona (sn), Somalia (so), Albania (sq), Sesotho (st), Sunda (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)



Informasi tentang model lama

Vertex AI in Firebase mendukung semua model Gemini, termasuk model lama seperti Gemini 1.0 Pro dan Gemini 1.0 Pro Vision. Namun, sebaiknya gunakan model yang lebih baru dengan SDK kami. Model Gemini lama ini mendekati tanggal penghentiannya dan tidak menawarkan semua kemampuan model yang lebih baru.



Langkah berikutnya

Mencoba kemampuan Gemini API