Untuk aplikasi seluler dan web, SDK Vertex AI in Firebase memungkinkan Anda berinteraksi dengan model Gemini yang didukung langsung dari aplikasi Anda.
Model Gemini dianggap multimodal karena mampu memproses dan bahkan menghasilkan beberapa modalitas, termasuk teks, kode, PDF, gambar, video, dan audio.
Berikut adalah ringkasan singkat tentang model yang didukung untuk Vertex AI in Firebase dan versi stabil terbarunya. Bagian di halaman ini nanti memberikan perbandingan dan informasi selengkapnya.
Model | Input | Output | Dioptimalkan untuk |
---|---|---|---|
Model Gemini | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
teks, kode, PDF, gambar, video, audio | teks, kode, JSON (gambar & audio segera hadir!) |
Fitur, kecepatan, dan pembuatan multimodal generasi berikutnya untuk berbagai tugas |
Gemini 1.5 Progemini-1.5-pro-002 |
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Tugas penalaran kompleks yang memerlukan lebih banyak kecerdasan |
Gemini 1.5 Flashgemini-1.5-flash-002 |
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Performa yang cepat dan serbaguna di berbagai tugas |
Bagian lain dari halaman ini memberikan informasi mendetail tentang model yang didukung oleh Vertex AI in Firebase:
-
- Input dan output yang didukung
- Perbandingan tingkat tinggi kemampuan yang didukung
- Spesifikasi dan batasan, misalnya token input maksimum atau durasi maksimum video input
Deskripsi cara model diberi versi, khususnya versi stabil, diupdate otomatis, dan pratinjau
Daftar nama model yang tersedia untuk disertakan dalam kode Anda selama inisialisasi
Daftar bahasa yang didukung untuk model
Di bagian bawah halaman ini, Anda dapat melihat informasi mendetail tentang model lama.
Membandingkan model
Setiap model memiliki kemampuan yang berbeda untuk mendukung berbagai kasus penggunaan. Perhatikan bahwa setiap tabel di bagian ini menjelaskan setiap model saat digunakan dengan Vertex AI in Firebase. Setiap model mungkin memiliki kemampuan tambahan yang tidak tersedia saat menggunakan SDK kami.
Anda dapat mempelajari lebih lanjut setiap model Gemini dalam dokumentasi Google Cloud.
Input dan output yang didukung
Berikut adalah jenis input dan output yang didukung saat menggunakan setiap model dengan Vertex AI in Firebase:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
Jenis input | ||||
Teks | ||||
Kode | ||||
Dokumen (PDF atau teks biasa) | ||||
Gambar, Video, dan Audio | ||||
Audio (streaming) | segera hadir! | |||
Jenis output | ||||
Teks | ||||
Output terstruktur (seperti JSON) | ||||
Kode | ||||
Gambar | segera hadir! | |||
Audio | segera hadir! | |||
Audio (streaming) | segera hadir! |
Untuk mempelajari jenis file yang didukung, lihat File input dan persyaratan yang didukung untuk Vertex AI Gemini API.
Kemampuan dan fitur yang didukung
Berikut adalah kemampuan dan fitur yang didukung saat menggunakan setiap model dengan Vertex AI in Firebase:
Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash | ||
---|---|---|---|---|
Membuat teks dari teks atau multimodal input | ||||
Buat gambar | segera hadir! | |||
Membuat audio | segera hadir! | |||
Membuat output terstruktur (seperti JSON) | ||||
Menganalisis gambar dan video (visi) | ||||
Menganalisis audio | ||||
Menganalisis dokumen (PDF atau teks biasa) | ||||
Multi-turn chat | ||||
Panggilan fungsi (alat) | ||||
Panggilan fungsi dasar | ||||
Panggilan fungsi paralel | ||||
Mode panggilan fungsi | ||||
Menghitung token dan karakter yang dapat ditagih | ||||
Petunjuk sistem | ||||
Multimodal Live API (streaming dua arah) | segera hadir! |
Spesifikasi dan batasan
Berikut adalah spesifikasi dan batasan saat menggunakan setiap model dengan Vertex AI in Firebase:
Properti | Gemini 2.0 Flash | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|
Jendela konteks * Total batas token (input+output gabungan) |
1.048.576 token | 2.097.152 token | 1.048.576 token |
Batas token output * | 8.192 token | 8.192 token | 8.192 token |
Tanggal batas waktu Knowledge | Juni 2024 | Mei 2024 | Mei 2024 |
Gambar (per permintaan) | |||
Jumlah maksimum gambar input | 3.000 gambar | 3.000 gambar | 3.000 gambar |
Jumlah maksimum gambar output | segera hadir! | --- | --- |
Ukuran maksimum per input gambar berenkode base64 | 7 MB | 7 MB | 7 MB |
PDF (sesuai permintaan) | |||
Jumlah maksimum file PDF input ** | 3.000 file | 3.000 file | 3.000 file |
Jumlah maksimum halaman per file PDF input ** | 1.000 halaman | 1.000 halaman | 1.000 halaman |
Ukuran maksimum per file PDF input | 50 MB | 50 MB | 50 MB |
Video (sesuai permintaan) | |||
Jumlah maksimum file video input | 10 file | 10 file | 10 file |
Durasi maksimum semua video input (hanya frame) | ~60 menit | ~60 menit | ~60 menit |
Durasi maksimum semua video input (frame+audio) | ~45 menit | ~45 menit | ~45 menit |
Audio (sesuai permintaan) | |||
Jumlah maksimum file audio input | 1 file | 1 file | 1 file |
Jumlah maksimum file audio output | segera hadir! | --- | --- |
Panjang maksimum semua audio input | ~8,4 jam | ~8,4 jam | ~8,4 jam |
Panjang maksimum semua audio output | segera hadir! | --- | --- |
* Untuk semua model, token setara dengan sekitar 4 karakter, sehingga 100 token setara dengan sekitar 60-80 kata dalam bahasa Inggris. Untuk model Gemini, Anda dapat
menentukan jumlah total token dalam permintaan menggunakan
countTokens
.
** PDF diperlakukan sebagai gambar, sehingga satu halaman PDF diperlakukan sebagai satu gambar. Jumlah halaman yang diizinkan dalam permintaan dibatasi pada jumlah gambar yang dapat didukung model.
Menemukan informasi mendetail tambahan
Kuota dan harga berbeda untuk setiap model. Harga juga bergantung pada input dan output.
Pelajari jenis file input yang didukung, cara menentukan jenis MIME, dan cara memastikan bahwa file input dan permintaan multimodal Anda memenuhi persyaratan dan mengikuti praktik terbaik di File input dan persyaratan yang didukung untuk Vertex AI Gemini API.
Pola penamaan dan pembuatan versi model
Model ditawarkan dalam versi stabil, diupdate otomatis, dan pratinjau.
Versi Stabil dianggap Tersedia Secara Umum.
- Versi stabil memiliki nama model yang ditambahkan dengan
nomor versi tiga digit tertentu, misalnya
.gemini-2.0-flash-001
- Versi stabil memiliki nama model yang ditambahkan dengan
nomor versi tiga digit tertentu, misalnya
Versi diupdate otomatis selalu mengarah ke versi stabil terbaru dari model tersebut; jika versi stabil baru dirilis, versi diupdate otomatis akan otomatis mulai mengarah ke versi stabil baru tersebut.
- Versi yang diperbarui secara otomatis memiliki nama model tanpa
akhiran, misalnya
.gemini-2.0-flash
- Versi yang diperbarui secara otomatis memiliki nama model tanpa
akhiran, misalnya
Versi Pratinjau memiliki kemampuan baru dan dianggap tidak stabil. Perhatikan bahwa versi pratinjau selalu mengarah ke versi pratinjau terbaru dari model tersebut; jika versi pratinjau baru dirilis, versi pratinjau yang ada akan otomatis mulai mengarah ke versi pratinjau baru tersebut.
- Versi pratinjau memiliki nama model yang ditambahkan dengan
beserta tanggal rilis awal model (-preview
), misalnya-MMDD
(dirilis pada 9 April 2024).gemini-1.5-pro-preview-0409
- Versi pratinjau memiliki nama model yang ditambahkan dengan
Pelajari lebih lanjut versi model yang tersedia dan siklus prosesnya (Gemini) dalam dokumentasi Google Cloud.
Nama model yang tersedia
Nama model adalah nilai eksplisit yang Anda sertakan dalam kode selama inisialisasi model generatif (yang merupakan langkah yang diperlukan untuk memanggil Gemini API).
Anda dapat menggunakan
endpoint publishers.models.list
untuk mencantumkan semua nama model yang tersedia. Perhatikan bahwa daftar yang ditampilkan ini akan menyertakan
semua model yang didukung Vertex AI, tetapi Vertex AI in Firebase hanya mendukung
model Gemini yang dijelaskan di halaman ini.
Perhatikan juga bahwa versi yang diperbarui secara otomatis (misalnya, gemini-2.0-flash
) tidak
tercantum karena merupakan alias praktis untuk model stabil dasar.
Nama model Gemini
Untuk contoh inisialisasi bahasa Anda, lihat panduan memulai.
Nama model Gemini 2.0 Flash
Nama model | Deskripsi | Tahap rilis | Tanggal rilis awal | Tanggal penghentian |
---|---|---|---|---|
Versi stabil | ||||
gemini-2.0-flash-001 |
Gemini 2.0 Flash versi stabil terbaru | Ketersediaan Umum | 2025-02-05 | Belum ditentukan |
Versi yang diupdate otomatis | ||||
gemini-2.0-flash |
Menunjuk ke versi stabil terbaru 2.0 Flash (saat ini gemini-2.0-flash-001 |
Ketersediaan Umum | 2025-02-10 | --- |
Nama model Gemini 1.5 Pro
Nama model | Deskripsi | Tahap rilis | Tanggal rilis awal | Tanggal penghentian |
---|---|---|---|---|
Versi stabil | ||||
gemini-1.5-pro-002 |
Gemini 1.5 Pro versi stabil terbaru | Ketersediaan Umum | 2024-09-24 | Tidak lebih awal dari 24-09-2025 |
gemini-1.5-pro-001 |
Versi stabil awal Gemini 1.5 Pro | Ketersediaan Umum | 2024-05-24 | Tidak lebih awal dari 24-05-2025 |
Versi yang diupdate otomatis | ||||
gemini-1.5-pro |
Menunjuk ke versi stabil terbaru 1.5 Pro (saat ini gemini-1.5-pro-002 |
Ketersediaan Umum | 2024-09-24 | --- |
Nama model Gemini 1.5 Flash
Nama model | Deskripsi | Tahap rilis | Tanggal rilis awal | Tanggal penghentian |
---|---|---|---|---|
Versi stabil | ||||
gemini-1.5-flash-002 |
Gemini 1.5 Flash versi stabil terbaru | Ketersediaan Umum | 2024-09-24 | Tidak lebih awal dari 24-09-2025 |
gemini-1.5-flash-001 |
Versi stabil awal Gemini 1.5 Flash | Ketersediaan Umum | 2024-05-24 | Tidak lebih awal dari 24-05-2025 |
Versi yang diupdate otomatis | ||||
gemini-1.5-flash |
Menunjuk ke versi stabil terbaru Flash 1.5 (saat ini gemini-1.5-flash-002 |
Ketersediaan Umum | 2024-09-24 | --- |
Bahasa yang didukung
Gemini
Semua model Gemini dapat memahami dan merespons dalam bahasa berikut:
Arab (ar), Bengali (bn), Bulgaria (bg), China aksara sederhana dan tradisional (zh), Kroasia (hr), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Jerman (de), Yunani (el), Ibrani (iw), Hindi (hi), Hungaria (hu), Indonesia (id), Italia (it), Jepang (ja), Korea (ko), Latvia (lv), Lituania (lt), Norwegia (no), Polandia (pl), Portugis (pt), Rumania (ro), Rusia (ru), Serbia (sr), Slovakia (sk), Slovenia (sl), Spanyol (es), Swahili (sw), Swedia (sv), Thailand (th), Turkiye (tr), Ukraina (uk), Vietnam (vi)
Model Gemini 1.5 Pro dan Gemini 1.5 Flash dapat memahami dan merespons dalam bahasa tambahan berikut:
Afrikaans (af), Amharik (am), Assam (as), Azerbaijan (az), Belarus (be), Bosnia (bs), Katalan (ca), Cebuano (ceb), Korsika (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persia (fa), Filipina (Tagalog) (fil), Frisia (fy), Irlandia (ga), Gaelik Skotlandia (gd), Galisia (gl), Gujarat (gu), Hausa (ha), Hawaii (haw), Hmong (hmn), Kreol Haiti (ht), Armenia (hy), Igbo (ig), Islandia (is), Jawa (jv), Georgia (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdi (ku), Kirgiz (ky), Latin (la), Luksemburg (lb), Laos (lo), Malagasy (mg), Maori (mi), Makedonia (mk), Malayalam (ml), Mongolia (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Melayu (ms), Malta (mt), Myanmar (Burma) (my), Nepal (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoa (sm), Shona (sn), Somalia (so), Albania (sq), Sesotho (st), Sunda (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Informasi tentang model lama
Vertex AI in Firebase mendukung semua model Gemini, termasuk model lama seperti Gemini 1.0 Pro dan Gemini 1.0 Pro Vision. Namun, sebaiknya gunakan model yang lebih baru dengan SDK kami. Model Gemini lama ini mendekati tanggal penghentiannya dan tidak menawarkan semua kemampuan model yang lebih baru.
Langkah berikutnya
Mencoba kemampuan Gemini API
- Buat percakapan multi-giliran (chat).
- Buat teks dari perintah khusus teks.
- Buat teks dari perintah multimodal (termasuk teks, gambar, PDF, video, dan audio).
- Buat output terstruktur (seperti JSON) dari prompt teks dan multimodal.
- Gunakan panggilan fungsi untuk menghubungkan model generatif ke sistem dan informasi eksternal.