Rangkaian model Gemini dianggap multimodal karena mampu memproses informasi dari beberapa modalitas, termasuk gambar, video, dan teks. Misalnya, Anda dapat mengirim foto sepiring kue ke model Gemini dan memintanya untuk memberikan resep kue tersebut.
Perintah | Respons |
Give me a recipe for these cookies. ![]() |
**INGREDIENTS**
|
Anda dapat berinteraksi dengan rangkaian model Gemini menggunakan Gemini API yang disediakan oleh Vertex AI di Google Cloud. Untuk aplikasi seluler dan web, Anda dapat menggunakan SDK Vertex AI in Firebase untuk memanggil Gemini API dan berinteraksi dengan model Gemini langsung dari aplikasi Anda.
Halaman ini memberikan informasi berikut tentang model Gemini:
Perbandingan tingkat tinggi kasus penggunaan untuk berbagai model Gemini, termasuk jenis input yang didukungnya.
Perbandingan detail untuk setiap model, misalnya token input maksimum atau panjang video maksimum.
Deskripsi cara model Gemini diberi versi, khususnya versi stabil, diupdate otomatis, dan pratinjau.
Daftar nama model yang tersedia untuk disertakan dalam kode Anda selama inisialisasi.
Daftar bahasa yang didukung untuk model Gemini.
Model yang tersedia
Anda dapat menggunakan salah satu model Gemini berikut dengan Vertex AI in Firebase:
Gemini 1.5 Flash
Model multimodal yang mendukung jenis input dan output yang sama dengan 1.5 Pro, tetapi dengan pemahaman konteks panjang sebesar 1 juta token. Gemini 1.5 Flash dirancang secara khusus untuk aplikasi dengan volume tinggi dan hemat biaya.Gemini 1.5 Pro
Model multimodal yang mendukung penambahan file gambar, audio, video, dan PDF dalam perintah teks atau chat untuk menghasilkan respons teks atau kode. Selain itu, model ini mendukung pemahaman konteks panjang dengan 2 juta token.Gemini 1.0 Pro Vision
Model multimodal yang dirancang untuk menangani teks serta gambar dan video untuk respons teks atau kode. Tidak dapat digunakan untuk chat.Gemini 1.0 Pro
Model yang dirancang untuk menangani tugas bahasa alami, chat multi-putaran dengan teks dan kode, serta pembuatan kode.
Buka nama model yang akan disertakan dalam kode Anda
Kasus penggunaan dan kemampuan untuk setiap model
Setiap model Gemini memiliki kemampuan yang berbeda untuk mendukung berbagai kasus penggunaan. Anda dapat mempelajari lebih lanjut dalam dokumentasi Google Cloud tentang setiap model Gemini.
Input dan output yang didukung untuk setiap model
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
Jenis input | ||||
Teks | ||||
Kode | ||||
Gambar | ||||
Video (khusus frame) | ||||
Video (frame dan audio) | ||||
Audio | ||||
Jenis output | ||||
Teks | ||||
Output terstruktur (seperti JSON) menggunakan skema respons | ||||
Kode |
Untuk mempelajari jenis file yang didukung, lihat File input dan persyaratan yang didukung untuk Vertex AI Gemini API.
Kemampuan yang didukung dan fitur umum untuk setiap model
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|---|---|
Pembuatan teks dari input khusus teks | |||||
Pembuatan teks dari input multimodal | |||||
Output terstruktur (seperti JSON) menggunakan skema respons | |||||
Multi-turn chat | |||||
Panggilan fungsi | |||||
Panggilan fungsi dasar | |||||
Panggilan fungsi paralel | |||||
Mode panggilan fungsi | |||||
Menghitung token dan karakter yang dapat ditagih | |||||
Petunjuk sistem |
Informasi mendetail tentang setiap model
Properti (per permintaan) | Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|---|
Total batas token (gabungan input dan output) * | 1.048.576 token | 2.097.152 token | 16.384 token | 32.760 token |
Batas token output * | 8.192 token | 8.192 token | 2.048 token | 8.192 token |
Jumlah maksimum gambar input | 3.000 gambar | 3.000 gambar | 16 gambar | --- |
Ukuran maksimum per gambar berenkode base64 | 7 MB | 7 MB | 7 MB | --- |
Jumlah maksimum file PDF input ** | 3.000 file | 3.000 file | 16 file | --- |
Jumlah maksimum halaman per file PDF ** | 1.000 halaman | 1.000 halaman | 16 halaman | --- |
Ukuran maks per file PDF | 50 MB | 50 MB | 50 MB | --- |
Jumlah maksimum file video input | 10 file | 10 file | 1 file | --- |
Durasi maksimum semua video input (hanya frame) | 60 menit | 60 menit | 2 menit | --- |
Durasi maksimum semua video input (frame+audio) | ~50 menit | ~50 menit | --- | --- |
Jumlah maksimum file audio input | 1 file | 1 file | --- | --- |
Durasi maksimum semua audio input | ~8,4 jam | ~8,4 jam | --- | --- |
* Untuk semua model Gemini, token setara dengan sekitar 4 karakter,
sehingga 100 token adalah sekitar 60-80 kata dalam bahasa Inggris. Anda dapat menentukan jumlah total
token dalam permintaan menggunakan
countTokens
.
** PDF diperlakukan sebagai gambar, sehingga satu halaman PDF diperlakukan sebagai satu gambar. Jumlah halaman yang diizinkan dalam permintaan dibatasi pada jumlah gambar yang dapat didukung model.
Pelajari jenis file yang didukung, cara menentukan jenis MIME, dan cara memastikan file dan permintaan multimodal Anda memenuhi persyaratan serta mengikuti praktik terbaik di Persyaratan dan file input yang didukung untuk Vertex AI Gemini API.
Pola penamaan dan pembuatan versi model
Model ditawarkan dalam versi stabil, diupdate otomatis, dan pratinjau.
Versi Stabil dianggap Tersedia Secara Umum.
- Versi stabil memiliki nama model yang ditambahkan dengan
nomor versi tiga digit tertentu, misalnya
.gemini-2.0-flash-001
- Versi stabil memiliki nama model yang ditambahkan dengan
nomor versi tiga digit tertentu, misalnya
Versi diupdate otomatis selalu mengarah ke versi stabil terbaru dari model tersebut; jika versi stabil baru dirilis, versi diupdate otomatis akan otomatis mulai mengarah ke versi stabil baru tersebut.
- Versi yang diperbarui secara otomatis memiliki nama model tanpa
akhiran, misalnya
.gemini-2.0-flash
- Versi yang diperbarui secara otomatis memiliki nama model tanpa
akhiran, misalnya
Versi Pratinjau memiliki kemampuan baru dan dianggap tidak stabil. Perhatikan bahwa versi pratinjau selalu mengarah ke versi pratinjau terbaru dari model tersebut; jika versi pratinjau baru dirilis, versi pratinjau yang ada akan otomatis mulai mengarah ke versi pratinjau baru tersebut.
- Versi pratinjau memiliki nama model yang ditambahkan dengan
beserta tanggal rilis awal model (-preview
), misalnya-MMDD
(dirilis pada 9 April 2024).gemini-1.5-pro-preview-0409
- Versi pratinjau memiliki nama model yang ditambahkan dengan
Pelajari lebih lanjut versi model Gemini yang tersedia dan siklus prosesnya di dokumentasi Google Cloud.
Nama model yang tersedia
Nama model adalah nilai eksplisit yang Anda sertakan dalam kode selama inisialisasi model generatif (yang merupakan langkah yang diperlukan untuk memanggil Gemini API). Untuk contoh inisialisasi bahasa Anda, lihat panduan memulai.
Nama model Gemini 2.0 Flash
Nama model | Deskripsi | Tahap rilis | Tanggal rilis awal | Tanggal penghentian |
---|---|---|---|---|
Versi stabil | ||||
gemini-2.0-flash-001 |
Gemini 2.0 Flash versi stabil terbaru | Ketersediaan Umum | 2025-02-05 | Belum ditentukan |
Versi yang diupdate otomatis | ||||
gemini-2.0-flash |
Menunjuk ke versi stabil terbaru 2.0 Flash (saat ini gemini-2.0-flash-001 |
Ketersediaan Umum | 2025-02-05 | --- |
Nama model Gemini 1.5 Flash
Nama model | Deskripsi | Tahap rilis | Tanggal rilis awal | Tanggal penghentian |
---|---|---|---|---|
Versi stabil | ||||
gemini-1.5-flash-002 |
Versi stabil terbaru Gemini 1.5 Flash | Ketersediaan Umum | 2024-09-24 | Tidak lebih awal dari 24-09-2025 |
gemini-1.5-flash-001 |
Versi stabil awal Gemini 1.5 Flash | Ketersediaan Umum | 2024-05-24 | Tidak lebih awal dari 24-05-2025 |
Versi yang diupdate otomatis | ||||
gemini-1.5-flash |
Menunjuk ke versi stabil terbaru dari Flash 1.5 (saat ini gemini-1.5-flash-002 |
Ketersediaan Umum | 2024-09-24 | --- |
Nama model Gemini 1.5 Pro
Nama model | Deskripsi | Tahap rilis | Tanggal rilis awal | Tanggal penghentian |
---|---|---|---|---|
Versi stabil | ||||
gemini-1.5-pro-002 |
Versi stabil terbaru Gemini 1.5 Pro | Ketersediaan Umum | 2024-09-24 | Tidak lebih awal dari 24-09-2025 |
gemini-1.5-pro-001 |
Versi stabil awal Gemini 1.5 Pro | Ketersediaan Umum | 2024-05-24 | Tidak lebih awal dari 24-05-2025 |
Versi yang diupdate otomatis | ||||
gemini-1.5-pro |
Menunjuk ke versi stabil terbaru 1.5 Pro (saat ini gemini-1.5-pro-002 |
Ketersediaan Umum | 2024-09-24 | --- |
Nama model Gemini 1.0 Pro Vision
Nama model | Deskripsi | Tahap rilis | Tanggal rilis awal | Tanggal penghentian |
---|---|---|---|---|
Versi stabil | ||||
gemini-1.0-pro-vision-001 |
Versi stabil terbaru Gemini 1.0 Pro Vision | Ketersediaan Umum | 2024-02-15 | Tidak lebih awal dari 15-02-2025 |
Versi yang diupdate otomatis | ||||
gemini-1.0-pro-vision |
Menunjuk ke versi stabil terbaru 1.5 Pro Vision (saat ini gemini-1.5-pro-vision-001 |
Ketersediaan Umum | 2024-01-04 | --- |
Nama model Gemini 1.0 Pro
Nama model | Deskripsi | Tahap rilis | Tanggal rilis awal | Tanggal penghentian |
---|---|---|---|---|
Versi stabil | ||||
gemini-1.0-pro-002 |
Versi stabil terbaru Gemini 1.0 Pro | Ketersediaan Umum | 2024-04-09 | Tidak lebih awal dari 09-04-2025 |
gemini-1.0-pro-001 |
Versi stabil Gemini 1.0 Pro | Ketersediaan Umum | 2024-02-15 | Tidak lebih awal dari 15-02-2025 |
Versi yang diupdate otomatis | ||||
gemini-1.0-pro |
Menunjuk ke versi stabil terbaru 1.0 Pro (saat ini gemini-1.0-pro-002 |
Ketersediaan Umum | 2024-02-15 | --- |
Bahasa yang didukung
Semua model Gemini dapat memahami dan merespons dalam bahasa berikut:
Arab (ar), Bengali (bn), Bulgaria (bg), China aksara sederhana dan tradisional (zh), Kroasia (hr), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Jerman (de), Yunani (el), Ibrani (iw), Hindi (hi), Hungaria (hu), Indonesia (id), Italia (it), Jepang (ja), Korea (ko), Latvia (lv), Lituania (lt), Norwegia (no), Polandia (pl), Portugis (pt), Rumania (ro), Rusia (ru), Serbia (sr), Slovakia (sk), Slovenia (sl), Spanyol (es), Swahili (sw), Swedia (sv), Thailand (th), Turkiye (tr), Ukraina (uk), Vietnam (vi)
Model Gemini 1.5 Pro dan Gemini 1.5 Flash dapat memahami dan merespons dalam bahasa tambahan berikut:
Afrikaans (af), Amharik (am), Assam (as), Azerbaijan (az), Belarus (be), Bosnia (bs), Katalan (ca), Cebuano (ceb), Korsika (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persia (fa), Filipina (Tagalog) (fil), Frisia (fy), Irlandia (ga), Gaelik Skotlandia (gd), Galisia (gl), Gujarat (gu), Hausa (ha), Hawaii (haw), Hmong (hmn), Kreol Haiti (ht), Armenia (hy), Igbo (ig), Islandia (is), Jawa (jv), Georgia (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdi (ku), Kirgiz (ky), Latin (la), Luksemburg (lb), Laos (lo), Malagasy (mg), Maori (mi), Makedonia (mk), Malayalam (ml), Mongolia (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Melayu (ms), Malta (mt), Myanmar (Burma) (my), Nepal (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoa (sm), Shona (sn), Somalia (so), Albania (sq), Sesotho (st), Sunda (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Langkah berikutnya
Mencoba kemampuan Gemini API
- Buat percakapan multi-giliran (chat).
- Buat teks dari perintah khusus teks.
- Buat teks dari perintah multimodal (termasuk teks, gambar, PDF, video, dan audio).
- Buat output terstruktur (seperti JSON) dari prompt teks dan multimodal.
- Gunakan panggilan fungsi untuk menghubungkan model generatif ke sistem dan informasi eksternal.