Firebase is back at Cloud Next on April 9 - 11. Register now.

このページは Cloud Translation API によって翻訳されました。

Gemini モデルのトークンと課金対象文字数をカウントする

生成モデルは、データをトークンという単位に分割して処理します。各モデルには、プロンプトとレスポンスで処理できるトークンの最大数があります。

このページでは、Count Tokens API を使用して、Gemini モデルへのリクエストの推定トークン数と課金対象文字数を取得する方法について説明します。レスポンスでトークンの推定値を取得するための API はありません。

Imagen モデルには Count Tokens API を使用できません。

カウントにはどのような情報が提供されますか？

トークンと課金対象文字数のカウントについて、次の点に注意してください。

トークンの合計数をカウントする
- このカウントは、リクエストが許容されるコンテキストウィンドウを超えないようにするのに役立ちます。
- トークン数には、リクエスト入力の一部として指定されたすべてのファイル（画像など）のサイズが反映されます。動画内の画像数や秒数はカウントされません。
- すべての Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60 ～ 80 ワード（英語）です。
課金対象文字数の合計をカウントする
- Vertex AI では文字数が料金計算の一部となるため、このカウントは費用の把握と管理に役立ちます。
- 課金対象の文字数には、リクエスト入力の一部として指定されたテキストの文字数が反映されます。

古い Gemini モデルでは、トークンは料金計算の対象外ですが、Gemini 2.0 モデルでは料金計算に使用されます。詳しくは、モデルあたりのトークン数の上限とモデルあたりの料金をご覧ください。

トークンと課金対象文字数のカウントの料金と割り当て

CountTokens API の使用に料金や割り当ての制限はありません。CountTokens API の最大割り当ては、1 分あたり 3,000 リクエスト（RPM）です。

コードサンプル

テキストのみの入力

マルチモーダル入力

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2025-02-27 UTC。