トークンと課金対象文字数をカウントする


生成 AI モデル(Gemini モデルなど)は、データをトークンと呼ばれる単位に分割して処理します。各 Gemini モデルには、プロンプトとレスポンスで処理できるトークンの最大数があります

このページでは、リクエストのトークン数と課金対象文字数を見積もる方法について説明します。

カウントに含まれる情報は何ですか?

トークンと課金対象文字数のカウントについては、次の点に注意してください。

  • 合計トークンのカウント

    • この数は、リクエストが許容されるコンテキスト ウィンドウを超えないようにするのに役立ちます。

    • トークン数には、リクエスト入力の一部として提供されるすべてのファイル(画像など)のサイズが反映されます。画像の数や動画内の秒数はカウントされません

    • すべての Gemini モデルで、1 トークンは約 4 文字に相当します。100 個のトークンは、約 60 ~ 80 語の英語の単語です。

  • 課金対象文字数の合計のカウント

    • Vertex AI の場合、文字数が料金計算に含まれるため、この数は費用を把握して管理するのに役立ちます。

    • 課金対象の文字数は、リクエストの入力の一部として提供される テキストの文字数を反映します。

Vertex AI の場合、トークンは料金計算に含まれません。詳細については、モデルあたりのトークンの上限モデルごとの料金をご覧ください。

トークンと課金対象文字数のカウントの料金と割り当て

CountTokens API の使用に料金や割り当ての制限はありません。CountTokens API の最大割り当ては 1 分あたり 3,000 リクエストです。

コードサンプル

テキストのみの入力

マルチモーダル入力