Gemini model memproses input dan output dalam unit yang disebut token.
Token dapat berupa karakter tunggal seperti z atau seluruh kata seperti cat. Kata-kata panjang dipecah menjadi beberapa token. Kumpulan semua token yang digunakan oleh model disebut kosakata, dan proses pemisahan teks menjadi token disebut tokenisasi.
Untuk Gemini model, satu token setara dengan sekitar 4 karakter. 100 token setara dengan sekitar 60-80 kata dalam bahasa Inggris.
Setiap model memiliki jumlah maksimum token yang dapat ditangani dalam perintah dan respons. Dengan mengetahui jumlah token perintah, Anda dapat mengetahui apakah Anda telah melampaui batas ini. Selain itu, biaya permintaan ditentukan sebagian oleh jumlah token input dan output, sehingga mengetahui cara menghitung token dapat bermanfaat.
Model yang didukung
gemini-3.1-pro-previewgemini-3-flash-previewgemini-3.1-flash-litegemini-3-pro-image-previewgemini-3.1-flash-image-previewgemini-2.5-progemini-2.5-flashgemini-2.5-flash-lite
Opsi untuk menghitung token
Semua input dan output untuk Gemini API di-tokenisasi, termasuk teks, file gambar, dan modalitas non-teks lainnya. Berikut opsi untuk menghitung token:
- Periksa jumlah token untuk permintaan Anda saja (sebelum mengirimkannya ke model).
- Panggil
countTokensdengan input permintaan sebelum mengirimkannya ke model. Tindakan ini akan menampilkan:total_tokens: jumlah token input saja
- Periksa jumlah token untuk permintaan dan respons Anda.
- Akses atribut
usageMetadatapada objek respons. Hal ini mencakup:prompt_token_count: jumlah token input sajacandidates_token_count: jumlah token output saja (tidak termasuk token penalaran)thoughts_token_count: jumlah token penalaran yang digunakan untuk membuat responstotal_token_count: jumlah total token untuk keduanya input dan output (termasuk token penalaran)
Saat melakukan streaming output, atribut
usageMetadatahanya muncul di bagian terakhir streaming. Nilainya adalahniluntuk bagian perantara.
Perhatikan poin-poin berikut tentang opsi di atas:
- Opsi tersebut tidak akan menghitung jumlah gambar input atau jumlah detik dalam file input video atau audio. Namun, jumlah token untuk setiap modalitas ini akan berkorelasi dengan nilai ini.
- Jumlah token input mencakup perintah (teks dan file input apa pun) serta petunjuk dan alat sistem apa pun.
- Jumlah token output tidak menyertakan token penalaran apa pun; token tersebut disediakan di kolom terpisah.
- Tinjau informasi tambahan khusus untuk setiap jenis permintaan nanti di halaman ini.
- Model Gemini Live API tidak mendukung
countTokens. Selain itu, Firebase AI Logic does belum mendukung atributusageMetadatatersebut dalam respons dari Live API model, tetapi akan segera tersedia.
Harga untuk opsi ini
Memanggil
countTokens: Tidak ada biaya untuk memanggilcountTokens(Count Tokens API). Kuota maksimum untuk Count Tokens API adalah 3.000 permintaan per menit (RPM).Menggunakan atribut
usageMetadata: Atribut ini selalu ditampilkan sebagai bagian dari respons dan tidak dikenai token atau biaya apa pun.
Informasi tambahan
Berikut beberapa informasi tambahan saat menggunakan jenis permintaan tertentu.
Menghitung token input teks
Tidak ada informasi tambahan.
Menghitung token multi-turn (chat)
Perhatikan hal-hal berikut untuk memanggil countTokens saat menggunakan chat:
- Jika Anda memanggil
countTokensdengan histori chat, jumlah total token akan ditampilkan dari kedua peran dalam chat (total_tokens). - Untuk memahami seberapa besar giliran percakapan Anda berikutnya, Anda harus menambahkannya ke histori saat memanggil
countTokens.
Menghitung token input multimodal
Perhatikan poin-poin berikut tentang penghitungan token dengan input multimodal:
- Anda dapat secara opsional memanggil
countTokenspada teks dan file secara terpisah. - Untuk kedua opsi penghitungan token, Anda akan mendapatkan jumlah token yang sama, baik Anda memberikan file sebagai data inline atau menggunakan URL-nya.
File input gambar
File input gambar dikonversi menjadi token berdasarkan dimensinya:
- Input gambar dengan kedua dimensi kurang dari atau sama dengan 384 piksel: setiap gambar dihitung sebagai 258 token.
- Input gambar yang lebih besar dalam satu atau kedua dimensi: setiap gambar dipangkas dan diskalakan sesuai kebutuhan menjadi petak 768x768 piksel, lalu setiap petak dihitung sebagai 258 token.
File input video dan audio
File input video dan audio dikonversi menjadi token dengan tarif tetap berikut:
- Video: 263 token per detik
- Audio: 32 token per detik
File input dokumen (seperti PDF)
File input PDF diperlakukan sebagai gambar, sehingga setiap halaman PDF di-tokenisasi dengan cara yang sama seperti gambar.