Halaman ini menjelaskan kuota dan struktur harga untuk Gemini API dari Vertex AI.
Kuota berdasarkan region dan model
Kuota permintaan per menit (RPM) berlaku untuk model dasar dan semua versi, ID, serta versi yang telah disesuaikan dari model tersebut. Berikut beberapa contohnya:
Permintaan ke
gemini-1.0-pro
dan permintaan kegemini-1.0-pro-001
dihitung sebagai dua permintaan terhadap kuota RPM model dasar,gemini-1.0 pro
.Permintaan ke
gemini-1.0-pro-001
dan permintaan ke model yang disesuaikan yang didasarkan padagemini-1.0-pro-001
dihitung sebagai dua permintaan terhadap kuota RPM model dasar,gemini-1.0-pro
.
Kuota ini berlaku di level project dan digunakan bersama oleh semua aplikasi dan alamat IP yang menggunakan project Firebase tersebut. Selain itu, kuota ini berlaku untuk semua panggilan ke Gemini API, baik menggunakan Vertex AI for Firebase SDK, SDK server (termasuk melalui Gemini Firebase Extensions), panggilan REST, atau Vertex AI Studio.
Temukan kuota untuk setiap model untuk setiap region dalam dokumentasi Google Cloud.
Meminta penambahan kuota
Jika ingin meningkatkan kuota untuk Vertex AI, Anda dapat menggunakan Konsol Google Cloud untuk meminta penambahan kuota. Untuk mempelajari kuota lebih lanjut, lihat Mengelola kuota.
Harga
Untuk menggunakan Gemini API dari Vertex AI, project Firebase Anda harus menggunakan paket harga bayar sesuai penggunaan Blaze.
Temukan harga untuk setiap model dalam dokumentasi Google Cloud.