Gemini 3 Pro & Flash, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

Gemini 2.0 Flash and Flash-Lite models will be retired on March 3, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Learn more.

レート制限と割り当て

Gemini API プロバイダをクリックして、このページでプロバイダ固有のコンテンツとコードを表示します。

レート制限（通常は割り当てと呼ばれます）は、一定期間内に Gemini API に対して行うことができるリクエストの数を規制します。これらの上限は、公平な使用を保証し、不正使用から保護し、すべてのユーザーのシステムパフォーマンスを維持するのに役立ちます。

Firebase AI Logic を使用して Gemini モデルと Imagen モデルにリクエストを送信する場合、プロジェクトのレート上限は選択した「Gemini API」プロバイダによって異なります。Firebase AI Logic には、ユーザーごとのレート上限を設定する方法もあります。

Gemini Developer API のレート制限を表示する

割り当てを超えると、429 割り当て超過エラーが発生します。

レート制限（割り当て）の仕組み

レート制限（割り当て）は、次の 4 つのディメンションで測定されます。

1 分あたりのリクエスト数（RPM）
1 日あたりのリクエスト数（RPD）
1 分あたりのトークン数（TPM）
1 日あたりのトークン数（TPD）

使用量は各上限に対して評価され、いずれかの上限を超えると 429 割り当て超過エラーがトリガーされます。たとえば、RPM 上限が 20 の場合、TPM やその他の上限を超えていなくても、1 分以内に 21 回のリクエストを行うとエラーが発生します。

レート制限はプロジェクトレベルで適用され、その Firebase プロジェクトを使用するすべてのアプリケーションと IP アドレスに適用されます。

上限は使用する特定のモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数（IPM）は、画像を生成できるモデル（Imagen）に対してのみ計算されますが、概念的には TPM と似ています。

試験運用版モデルとプレビュー版モデルでは、レート制限がより厳しくなります。

レート上限の引き上げをリクエストする

Gemini Developer API の「有料階層」をご利用の場合は、レート制限の引き上げをリクエストできます。

「ユーザーごと」のレート制限を設定する

Firebase AI Logic を使用するには、選択した Gemini API プロバイダを有効にする必要があります。また、Firebase AI Logic API も有効にする必要があります。この API は、クライアント SDK と Gemini API プロバイダ間のゲートウェイとして機能します。この API は、Firebase プロジェクトで Firebase AI Logic を最初に設定したときに有効になります。

Firebase AI Logic API のレート上限（割り当て）は、アプリの「ユーザーごと」のレート上限として使用できます。特に、Firebase AI Logic に依存する AI 機能で使用できます。この上限を設定して、AI 機能にアクセスする単一のユーザーを適切に収容すると同時に、単一のユーザーが Gemini API プロバイダの上限（すべてのユーザーが共有することを想定）を超えないようにする必要があります。

ユーザーごとのレート制限の詳細

Firebase AI Logic API のレート上限（割り当て）、特に 1 分あたりのリクエスト数（RPM）に関する重要な詳細は次のとおりです。

これは、ユーザー、リージョン、分単位の「コンテンツ生成リクエスト」に基づいており、モデルに基づくものではありません。
これは、すべてのユーザーに適用されるレート制限です。現在、特定のユーザーまたは特定のユーザーグループのレート上限を設定する方法はありません。^*
これはプロジェクトレベルで適用され、その Firebase プロジェクトを使用するすべてのアプリケーションと IP アドレスに適用されます。
これは、Firebase AI Logic SDK からの呼び出しに適用されます。
デフォルトのレート制限は、ユーザーあたり 100 RPM です。
なお、Gemini API プロバイダの制限（上記を参照）も考慮する必要があります。この制限は Firebase AI Logic API よりも優先されます。

^{* Vertex AI Gemini API を使用していて、アプリがユーザーをさまざまな地域に誘導する場合（Firebase Remote Config を使用するなど）、特定の地域のユーザーに特定のレート制限を設定できます。}

「ユーザーごと」のレート制限を調整する

レート制限（割り当て）を調整するには、serviceusage.quotas.update 権限が必要です。この権限は、オーナーロールと編集者ロールにデフォルトで含まれています。

レート制限（割り当て）を編集する、または引き上げをリクエストする方法は次のとおりです。

Google Cloud コンソールで、Firebase AI Logic API のページに移動します。
[管理] をクリックします。
ページの下部にある [割り当てとシステム上限] タブをクリックします。
テーブルをフィルタして、機能（コンテンツ生成のリクエスト）やリージョンなど、関心のある割り当てを表示します。

たとえば、サポートされているアジアのいずれかのリージョンでコンテンツリクエストを生成するユーザーごとの割り当てを表示する場合、フィルタは次のようになります。 Generate content requests + Dimension:region:asia

注: Dimension フィルタを作成するには、上記の例の値をコピーして貼り付けるのではなく、フィルタツールを使用する必要があります。また、(default) 割り当て行は Firebase AI Logic には適用されません。
目的の各割り当ての左側にあるチェックボックスをオンにします。
割り当ての行の末尾にあるをクリックし、[割り当てを編集] を選択します。
[割り当ての変更] フォームで、次の操作を行います。
1. [新しい値] フィールドに、引き上げ後の割り当てを入力します。
  
  この割り当てはプロジェクトレベルで適用され、その Firebase プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。
2. フォームのその他のフィールドに入力して、[完了] をクリックします。
3. [リクエストを送信] をクリックします。