The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

Gemini 2.0 Flash and Flash-Lite models were shut down on June 1, 2026. To avoid service disruption, update to a newer model like gemini-3.1-flash-lite. Learn more.

All Imagen models will shut down on June 24, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Menghitung token untuk model Gemini

Model Gemini memproses input dan output dalam unit yang disebut token.

Token dapat berupa karakter tunggal seperti z atau seluruh kata seperti cat. Kata-kata panjang dipecah menjadi beberapa token. Kumpulan semua token yang digunakan oleh model disebut kosakata, dan proses membagi teks menjadi token disebut tokenisasi.

Untuk model Gemini, satu token setara dengan sekitar 4 karakter. 100 token setara dengan sekitar 60-80 kata dalam bahasa Inggris.

Setiap model memiliki jumlah token maksimum yang dapat ditangani dalam perintah dan respons. Mengetahui jumlah token perintah memungkinkan Anda mengetahui apakah Anda telah melampaui batas ini. Selain itu, biaya permintaan ditentukan sebagian oleh jumlah token input dan output, jadi mengetahui cara menghitung token dapat membantu.

Model yang didukung

gemini-3.1-pro-preview
gemini-3.5-flash
gemini-3.1-flash-lite
gemini-3-pro-image-preview
gemini-3.1-flash-image-preview
gemini-2.5-pro
gemini-2.5-flash
gemini-2.5-flash-lite

Opsi untuk menghitung token

Semua input dan output untuk Gemini API di-tokenisasi, termasuk teks, file gambar, dan modalitas non-teks lainnya. Berikut opsi untuk menghitung token:

Periksa jumlah token untuk permintaan saja (sebelum mengirimkannya ke model).

Panggil countTokens dengan input permintaan sebelum mengirimkannya ke model. Hal ini akan menampilkan:

total_tokens: jumlah token input saja

Periksa jumlah token untuk permintaan dan respons Anda.

Akses atribut usageMetadata pada objek respons. Hal ini mencakup:

prompt_token_count: jumlah token hanya dari input
candidates_token_count: jumlah token output saja (tidak termasuk token penalaran)
thoughts_token_count: jumlah token penalaran yang digunakan untuk membuat respons
total_token_count: jumlah total token untuk input dan output (termasuk token penalaran)

Saat streaming output, atribut usageMetadata hanya muncul di bagian terakhir streaming. Ini adalah nil untuk chunk perantara.

Perhatikan poin-poin berikut tentang opsi di atas:

Metrik ini tidak menghitung jumlah gambar input atau jumlah detik dalam file input video atau audio. Namun, jumlah token untuk setiap modalitas ini akan berkorelasi dengan nilai ini.
Jumlah token input mencakup perintah (teks dan file input apa pun) serta petunjuk dan alat sistem.
Jumlah token output tidak menyertakan token pemikiran; token tersebut disediakan di kolom terpisah.
Tinjau informasi tambahan khusus untuk setiap jenis permintaan di bagian selanjutnya pada halaman ini.
Model Gemini Live API tidak mendukung countTokens. Selain itu, Firebase AI Logic belum mendukung atribut usageMetadata tersebut dalam respons dari model Live API, tetapi akan segera hadir.

Harga untuk opsi ini

Memanggil countTokens: Tidak ada biaya untuk memanggil countTokens (Count Tokens API). Kuota maksimum untuk Count Tokens API adalah 3.000 permintaan per menit (RPM).
Menggunakan atribut usageMetadata: Atribut ini selalu ditampilkan sebagai bagian dari respons dan tidak menimbulkan token atau biaya apa pun.

Informasi tambahan

Berikut informasi tambahan saat menangani jenis permintaan tertentu.

Menghitung token input teks

Tidak ada informasi tambahan.

Menghitung token multi-giliran (chat)

Perhatikan hal-hal berikut untuk memanggil countTokens saat menggunakan chat:

Jika Anda memanggil countTokens dengan histori chat, fungsi ini akan menampilkan total jumlah token dari kedua peran dalam chat (total_tokens).
Untuk memahami seberapa besar giliran percakapan Anda berikutnya, Anda perlu menambahkannya ke histori saat Anda memanggil countTokens.

Menghitung token input multimodal

Perhatikan poin-poin berikut tentang penghitungan token dengan input multimodal:

Secara opsional, Anda dapat memanggil countTokens pada teks dan file secara terpisah.
Untuk kedua opsi penghitungan token, Anda akan mendapatkan jumlah token yang sama, baik Anda memberikan file sebagai data inline maupun menggunakan URL-nya.

File input gambar

File input gambar dikonversi menjadi token berdasarkan dimensinya:

Input gambar dengan kedua dimensi kurang dari atau sama dengan 384 piksel: setiap gambar dihitung sebagai 258 token.
Input gambar yang lebih besar dalam satu atau kedua dimensi: setiap gambar dipangkas dan diskalakan sesuai kebutuhan menjadi petak 768x768 piksel, lalu setiap petak dihitung sebagai 258 token.

File input video dan audio

File input video dan audio dikonversi menjadi token dengan rasio tetap berikut:

Video: 263 token per detik
Audio: 32 token per detik

File input Dokumen (seperti PDF)

File input PDF diperlakukan sebagai gambar, sehingga setiap halaman PDF di-tokenisasi dengan cara yang sama seperti gambar.