生成 AI モデル(Gemini モデルなど)は、データをトークンという単位に分解して処理します。各 Gemini モデルには、プロンプトとレスポンスで処理できるトークンの最大数があります。
このページでは、リクエストのトークン数と課金対象の文字数を見積もる方法について説明します。
数にはどのような情報が含まれていますか?
トークンと課金対象文字数のカウントについては、次の点に注意してください。
トークンの合計数のカウント
この数は、リクエストが許容されるコンテキスト期間を超えないようにするのに役立ちます。
トークン数は、リクエスト入力の一部として提供されるすべてのファイル(画像など)のサイズを反映します。動画内の画像の数や秒数はカウントされません。
すべての Gemini モデルで、1 トークンは約 4 文字に相当します。100 トークンは約 60 ~ 80 英単語です。
課金対象文字数のカウント
Vertex AI では文字数が料金計算の一部であるため、この数は費用を把握して管理するのに役立ちます。
請求対象文字数には、request 入力の一部として指定されたテキストの文字数が反映されます。
Vertex AI の場合、トークンは料金計算には含まれません。詳細については、モデルあたりのトークンの上限とモデルごとの料金をご覧ください。
トークンと課金対象文字数をカウントするための料金と割り当て
CountTokens
API の使用に料金や割り当ての制限はかかりません。CountTokens
API の最大割り当ては 1 分あたり 3,000 リクエストです。