Untuk aplikasi seluler dan web, SDK Firebase AI Logic memungkinkan Anda berinteraksi dengan model Gemini dan model Imagen yang didukung langsung dari aplikasi Anda.
Model Gemini dianggap multimodal karena mampu memproses dan bahkan menghasilkan beberapa modalitas, termasuk teks, kode, PDF, gambar, video, dan audio. Model Imagen dapat diberi perintah dengan teks untuk membuat gambar.
Selain itu, tinjau FAQ kami tentang semua model yang didukung dan tidak didukung oleh Firebase AI Logic.
Model unggulan
Langsung ke perbandingan model
Gemini 3 Pro
gemini-3-pro-preview
Model terbaik kami untuk pemahaman multimodal, dan model yang paling canggih, dinamis, dan mampu mengodekan nuansa yang pernah kami buat, yang menghadirkan visual yang lebih kaya dan interaktivitas yang lebih mendalam, semuanya dibangun di atas fondasi penalaran canggih. (penagihan diperlukan)
Gemini 2.5 Pro
gemini-2.5-pro
Model pemikiran canggih kami, yang mampu melakukan penalaran atas masalah kompleks dalam kode, matematika, dan STEM, serta menganalisis set data, codebase, dan dokumen dalam jumlah besar menggunakan konteks panjang.
Gemini 2.5 Flash
gemini-2.5-flash
Model terbaik kami dalam hal performa harga, yang menawarkan kemampuan serba guna. 2.5 Flash paling cocok untuk pemrosesan skala besar, tugas bervolume tinggi dan latensi rendah yang memerlukan penalaran, dan kasus penggunaan agentik.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Model flash tercepat kami dioptimalkan untuk efisiensi biaya dan throughput tinggi.
Model pembuatan gambar
Anda dapat membuat gambar dengan model Gemini atau Imagen.
Langsung ke perbandingan model
Gemini
Gemini 2.5 Flash Image (alias nano banana)
gemini-2.5-flash-image
Model Flash standar kami yang diupgrade untuk alur kerja kreatif yang cepat dengan kemampuan pembuatan gambar dan pengeditan percakapan bolak-balik. (penagihan diperlukan)
Imagen
Imagen 4
imagen-4.0-generate-001
Menghasilkan gambar realistis berkualitas tinggi dari perintah teks bahasa alami. (penagihan diperlukan)
Imagen 4 Fast
imagen-4.0-fast-generate-001
Membuat gambar untuk pembuatan prototipe atau kasus penggunaan latensi rendah. (penagihan diperlukan)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
Menghasilkan gambar realistis berkualitas tinggi dari perintah teks bahasa alami. (penagihan diperlukan)
Model generasi sebelumnya
Model berikut aktif, tetapi merupakan model generasi sebelumnya. Sebaiknya gunakan salah satu model terbaru jika memungkinkan.
Langsung ke perbandingan model
Model Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
Model andalan generasi kedua kami, dengan jendela konteks 1 juta token. Menyediakan fitur generasi berikutnya dan kemampuan yang ditingkatkan, termasuk kecepatan yang lebih tinggi dan penggunaan alat native.
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Model pekerja keras kecil generasi kedua kami, dengan jendela konteks 1 juta token. Dioptimalkan untuk efisiensi biaya dan latensi rendah.
Bagian selanjutnya di halaman ini memberikan informasi mendetail tentang model yang didukung oleh Firebase AI Logic.
-
- Input dan output yang didukung
- Perbandingan umum kemampuan yang didukung
- Spesifikasi dan batasan, misalnya token input maksimum atau panjang maksimum video input
Deskripsi cara model diberi versi, khususnya versi stabil, diperbarui otomatis, pratinjau, dan eksperimental
Daftar nama model yang tersedia untuk disertakan dalam kode Anda selama inisialisasi
Daftar bahasa yang didukung untuk model
Di bagian bawah halaman ini, Anda dapat melihat informasi mendetail tentang model generasi sebelumnya.
Bandingkan model
Setiap model memiliki kemampuan yang berbeda untuk mendukung berbagai kasus penggunaan. Perhatikan bahwa setiap tabel di bagian ini menjelaskan setiap model saat digunakan dengan Firebase AI Logic. Setiap model mungkin memiliki kemampuan tambahan yang tidak tersedia saat menggunakan SDK kami.
Jika Anda tidak dapat menemukan informasi yang Anda cari di sub-bagian berikut, Anda dapat menemukan lebih banyak informasi di dokumentasi penyedia API pilihan Anda:
Gemini Developer API: Model Gemini dan model Imagen
Vertex AI Gemini API: Model Gemini dan model Imagen
Input dan output yang didukung
Berikut adalah jenis input dan output yang didukung saat menggunakan setiap model dengan Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gambar Flash Gemini 2.5 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (buat) | Imagen (kemampuan) | |
|---|---|---|---|---|---|---|
| Jenis input | ||||||
| Teks | ||||||
| Teks (streaming) | ||||||
| Kode | ||||||
| Dokumen (PDF atau teks biasa) |
||||||
| Gambar | ||||||
| Video | ||||||
| Audio | ||||||
| Audio (streaming) | ||||||
| Jenis output | ||||||
| Teks | ||||||
| Teks (streaming) | ||||||
| Kode | ||||||
| Output terstruktur (seperti JSON) |
||||||
| Gambar | ||||||
| Audio | ||||||
| Audio (streaming) | ||||||
Untuk mempelajari jenis file yang didukung, lihat File input yang didukung dan persyaratan.
Kemampuan dan fitur yang didukung
Berikut adalah kemampuan dan fitur yang didukung saat menggunakan setiap model dengan Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gambar Flash Gemini 2.5 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (buat) | Imagen (kemampuan) | |
|---|---|---|---|---|---|---|
| Berpikir | ||||||
| Membuat teks dari input multimodal atau khusus teks | disisipkan atau sebagai bagian dari gambar | streaming saja | ||||
|
Buat gambar (Gemini atau Imagen) |
||||||
|
Mengedit gambar (Gemini atau Imagen) |
||||||
| Membuat audio | streaming saja | |||||
|
Membuat
output terstruktur
(seperti JSON) |
||||||
|
Menganalisis dokumen
(PDF atau teks biasa) |
||||||
| Menganalisis gambar (vision) | ||||||
| Menganalisis video (penglihatan) | ||||||
| Menganalisis audio | streaming saja | |||||
| Multi-turn chat | ||||||
| Streaming multimodal dua arah | ||||||
| Panggilan fungsi | ||||||
| Eksekusi kode | ||||||
| Melakukan grounding dengan Google Penelusuran | ||||||
| Petunjuk sistem | ||||||
| Menghitung token |
Spesifikasi dan batasan
Berikut adalah spesifikasi dan batasan saat menggunakan setiap model dengan Firebase AI Logic:
| Properti |
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gambar Flash Gemini 2.5 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (buat) | Imagen (kemampuan) |
|---|---|---|---|---|---|---|
| Jendela konteks * Batas token total (input+output gabungan) |
1 juta token | 1.048.576 token | 32.768 token | 32.768 token | 480 token | 480 token |
| Batas token output * | 64 ribu token | 65.536 token | 8.192 token | 8.192 token | --- | --- |
| Tanggal batas informasi | Januari 2025 | Januari 2025 | June 2025 | Agustus 2024 | --- | --- |
| PDF (per permintaan) | ||||||
| Jumlah maksimum file PDF input ** |
900 file | 3.000 file | 3 file | --- | --- | --- |
| Jumlah maksimum halaman per file PDF input ** |
900 halaman | 1.000 halaman | 3 halaman | --- | --- | --- |
| Ukuran maks per file PDF input |
50 MB | 50 MB | 50 MB | --- | --- | --- |
| Gambar (per permintaan) | ||||||
| Jumlah maksimum gambar input |
1.000 gambar | 3.000 gambar | 3 gambar | --- | --- | 4 gambar |
| Jumlah maksimum gambar output |
--- | --- | 10 gambar | --- | 4 gambar | 4 gambar |
| Ukuran maks per input gambar berenkode base64 |
7 MB | 7 MB | 7 MB | --- | --- | --- |
| Video (sesuai permintaan) | ||||||
| Jumlah maksimum file video input |
10 file | 10 file | --- | --- | --- | --- |
| Durasi maksimum semua video input (hanya frame) |
~60 menit | ~60 menit | --- | --- | --- | --- |
| Panjang maksimum dari semua video input (frame+audio) |
~45 menit | ~45 menit | --- | --- | --- | --- |
| Audio (sesuai permintaan) | ||||||
| Jumlah maksimum file audio input |
1 file | 1 file | --- | --- | --- | --- |
| Jumlah maksimum file audio output |
--- | --- | --- | --- | --- | --- |
| Panjang maksimum semua audio input |
~8,4 jam | ~8,4 jam | ~8,4 jam | --- | --- | --- |
| Panjang maksimum semua audio output |
--- | --- | --- | --- | --- | --- |
*
Untuk semua model Gemini, satu token setara dengan sekitar 4 karakter,
jadi 100 token setara dengan sekitar 60-80 kata dalam bahasa Inggris. Untuk model Gemini, Anda dapat
menentukan jumlah total token dalam permintaan menggunakan
countTokens.
** PDF diperlakukan sebagai gambar, sehingga satu halaman PDF diperlakukan sebagai satu gambar. Jumlah halaman yang diizinkan dalam permintaan dibatasi hingga jumlah gambar yang dapat didukung model.
Menemukan informasi mendetail tambahan
Kuota dan harga berbeda untuk setiap model. Harga juga bergantung pada input dan output.
Pelajari jenis file input yang didukung, cara menentukan jenis MIME, dan cara memastikan file input dan permintaan multimodal Anda memenuhi persyaratan dan mengikuti praktik terbaik dalam File input dan persyaratan yang didukung.
Pola penamaan dan pembuatan versi model
Model ditawarkan dalam versi stabil, pratinjau, dan eksperimental. Untuk kemudahan, alias tanpa nilai versi eksplisit didukung.
Untuk menemukan nama model tertentu yang akan digunakan dalam kode Anda, lihat bagian "nama model yang tersedia" di halaman ini.
| Jenis versi / Tahap rilis |
Deskripsi | Pola nama model | |
|---|---|---|---|
| Stabil |
Versi Stabil tersedia dan didukung
untuk penggunaan produksi mulai tanggal rilis.
|
|
|
| Alias stabil yang diupdate otomatis (Khusus model Gemini 2.0) |
Diperbarui secara otomatis alias stabil selalu mengarah ke
versi stabil terbaru dari model tersebut.
|
Model Gemini 2.0 saja
Contoh: |
|
| Pratinjau |
Versi Pratinjau memiliki kemampuan baru dan
dianggap tidak stabil.
|
Nama model versi pratinjau ditambahkan dengan
Contoh: |
|
| Eksperimental |
Versi Eksperimental memiliki kemampuan baru
dan dianggap tidak stabil.
|
Nama model versi eksperimental ditambahi dengan
Contoh: |
|
| Pensiun |
Versi Dihentikan telah melewati tanggal penghentiannya dan telah dinonaktifkan secara permanen.
|
--- |
|
Nama model yang tersedia
Nama model adalah nilai eksplisit yang Anda sertakan dalam kode selama inisialisasi model.
Langsung ke nama model Gemini Langsung ke nama model Imagen
Mencantumkan semua model yang tersedia secara terprogram
Anda dapat mencantumkan semua nama model yang tersedia menggunakan REST API:
Gemini Developer API: Panggil endpoint
models.listVertex AI Gemini API: Panggil endpoint
publishers.models.list
Perhatikan bahwa daftar yang ditampilkan ini akan mencakup semua model yang didukung oleh penyedia API, tetapi Firebase AI Logic hanya mendukung model Gemini dan Imagen yang dijelaskan di halaman ini.
Perhatikan juga bahwa alias yang diperbarui otomatis (misalnya, gemini-2.0-flash) tidak
dicantumkan karena merupakan alias praktis untuk model dasar.
Gemini nama model
Untuk contoh inisialisasi platform Anda, lihat panduan memulai.
Untuk mengetahui detail tentang tahap rilis (terutama untuk kasus penggunaan, penagihan, dan penghentian), lihat pola penamaan dan pembuatan versi model.
Gemini 3 Pro nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
gemini-3-pro-preview |
Versi pratinjau Gemini 3 Pro | Pratinjau | 2025-11-18 | Belum ditentukan |
Gemini 2.5 Pro nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
gemini-2.5-pro |
Versi stabil Gemini 2.5 Pro | Stabil | 2025-06-17 | Tidak lebih awal dari 2026-06-17 |
Gemini 2.5 Flash nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
gemini-2.5-flash |
Versi stabil Gemini 2.5 Flash | Stabil | 2025-06-17 | Tidak lebih awal dari 2026-06-17 |
Gemini 2.5 Flash‑Lite nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Versi stabil Gemini 2.5 Flash‑Lite | Stabil | 2025-07-22 | Tidak lebih awal dari 2026-07-22 |
Nama model Gemini 2.5 Flash Image (alias "nano banana")
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
gemini-2.5-flash-image |
Versi stabil untuk Gemini 2.5 Flash Image (alias "nano banana") | Stabil | 2025-10-02 | Tidak lebih awal dari 2026-10-02 |
Gemini 2.5 Flash Live nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
gemini-live-2.5-flash |
Versi stabil untuk Gemini 2.5 Flash Live | Stabil (GA pribadi) 1 |
2025-06-01 | Tidak lebih awal dari 2026-06-01 |
gemini-live-2.5-flash-preview 2 |
Versi pratinjau untuk Gemini 2.5 Flash Live | Pratinjau | 2025-06-01 | Belum ditentukan |
Firebase AI Logic belum mendukung model audio
asli (seperti gemini-2.5-flash-native-audio-preview-09-2025).
1 Hubungi perwakilan tim akun Google Cloud Anda untuk meminta akses. 2 Tidak didukung oleh Vertex AI Gemini API, apa pun cara Anda mengaksesnya.
Gemini 2.0 Flash Live nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
gemini-2.0-flash-live-001 2 |
Versi stabil untuk Gemini 2.0 Flash Live | Stabil | 2025-04-01 | Tidak lebih awal dari 2026-04-01 |
gemini-2.0-flash-live-preview-04-09 |
Versi pratinjau untuk Gemini 2.0 Flash Live | Pratinjau | 2025-04-09 | Belum ditentukan |
2 Tidak didukung oleh Vertex AI Gemini API, apa pun cara Anda mengaksesnya.
Imagen nama model
Untuk contoh inisialisasi platform Anda, lihat panduan membuat gambar dengan Imagen.
Untuk mengetahui detail tentang tahap rilis (terutama untuk kasus penggunaan, penagihan, dan penghentian), lihat pola penamaan dan pembuatan versi model.
Imagen 4 nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Versi stabil Imagen 4 | Stabil | 2025-08-14 | Tidak lebih awal dari 14-08-2026 |
Imagen 4 Fast nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Versi stabil Imagen 4 Fast | Stabil | 2025-08-14 | Tidak lebih awal dari 14-08-2026 |
Imagen 4 Ultra nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Versi stabil Imagen 4 Ultra | Stabil | 2025-08-14 | Tidak lebih awal dari 14-08-2026 |
Imagen 3 Capability nama model
| Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
|---|---|---|---|---|
imagen-3.0-capability-001 3 |
Versi stabil awal Imagen 3 Capability | Stabil | 2024-12-10 | Tidak lebih awal dari 10-12-2025 |
3 Tidak didukung oleh Gemini Developer API, apa pun cara Anda mengaksesnya.
Bahasa yang didukung
Gemini
Semua model Gemini dapat memahami dan merespons dalam bahasa berikut:
Arab (ar), Bengali (bn), Bulgaria (bg), China sederhana dan tradisional (zh), Kroasia (hr), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Jerman (de), Yunani (el), Ibrani (iw), Hindi (hi), Hungaria (hu), Indonesia (id), Italia (it), Jepang (ja), Korea (ko), Latvia (lv), Lituania (lt), Norwegia (no), Polandia (pl), Portugis (pt), Rumania (ro), Rusia (ru), Serbia (sr), Slovakia (sk), Slovenia (sl), Spanyol (es), Swahili (sw), Swedia (sv), Thailand (th), Turkiye (tr), Ukraina (uk), Vietnam (vi)
Model Gemini 2.0 Flash, Gemini 1.5 Pro, dan Gemini 1.5 Flash dapat memahami dan merespons dalam bahasa tambahan berikut:
Afrikaans (af), Amharik (am), Assam (as), Azerbaijan (az), Belarusia (be), Bosnia (bs), Katalan (ca), Cebuano (ceb), Korsika (co), Wales (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persia (fa), Filipino (Tagalog) (fil), Frisia (fy), Irlandia (ga), Gaelik Skotlandia (gd), Galicia (gl), Gujarati (gu), Hausa (ha), Hawaii (haw), Hmong (hmn), Kreol Haiti (ht), Armenia (hy), Igbo (ig), Islandia (is), Jawa (jv), Georgia (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdi (ku), Kirgiz (ky), Latin (la), Luksemburg (lb), Laos (lo), Malagasi (mg), Maori (mi), Makedonia (mk), Malayalam (ml), Mongolia (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Melayu (ms), Malta (mt), Myanmar (Burma) (my), Nepal (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhala) (si), Samoa (sm), Shona (sn), Somalia (so), Albania (sq), Sesotho (st), Sunda (su), Tamil (ta), Telugu (te), Tajik (tg), Uighur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Imagen
Ketersediaan umum: Inggris
Pratinjau: China (aksara sederhana), China (aksara tradisional), Hindi, Jepang, Korea, Portugis, Spanyol
Informasi tentang model sebelumnya
Model berikut aktif, tetapi merupakan model generasi sebelumnya. Sebaiknya gunakan salah satu model terbaru jika memungkinkan.
Gemini model
| Model | Input | Output | Deskripsi |
|---|---|---|---|
Gemini 2.0 Flashgemini-2.0-flash-001
|
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Model multimodal kami dengan fitur generasi berikutnya dan kemampuan yang ditingkatkan, termasuk kecepatan yang lebih tinggi, penggunaan alat bawaan, dan jendela konteks 1 juta token |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Model Flash kami yang paling cepat dan hemat biaya. Model ini adalah jalur upgrade bagi pengguna 1.5 Flash yang menginginkan kualitas yang lebih baik dengan harga dan kecepatan yang sama. |
Imagen model
| Model | Input | Output | Deskripsi |
|---|---|---|---|
Imagen 3imagen-3.0-generate-002 |
teks | gambar | Menghasilkan gambar realistis berkualitas tinggi dari perintah teks bahasa alami |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
teks | gambar | Membuat gambar untuk pembuatan prototipe atau kasus penggunaan latensi rendah |
2 Tidak didukung oleh Gemini Developer API, apa pun cara Anda mengaksesnya.
Langkah berikutnya
Coba kemampuan Gemini API
- Bangun percakapan multi-turn (chat).
- Membuat teks dari perintah khusus teks.
- Buat teks dengan memberikan perintah menggunakan berbagai jenis file, seperti gambar, PDF, video, dan audio.
- Membuat output terstruktur (seperti JSON) dari prompt teks dan multimodal.
- Membuat gambar dari perintah teks (Gemini atau Imagen).
- Input dan output streaming (termasuk audio) menggunakan Gemini Live API.
- Gunakan alat (seperti panggilan fungsi dan perujukan dengan Google Penelusuran) untuk menghubungkan model Gemini ke bagian lain aplikasi Anda dan sistem serta informasi eksternal.