Gemini API の費用、使用状況、その他の指標をモニタリングすることは、本番環境のアプリを実行するうえで重要です。アプリの通常の使用パターンを把握し、重要なしきい値を超えないようにすることが重要です。
費用をモニタリングする
Firebase コンソールの [使用量と請求額] ダッシュボードで、Vertex AI Gemini API の呼び出しにかかるプロジェクトの費用を確認できます。
ダッシュボードに表示される費用は、Vertex AI in Firebase クライアント SDK を介した呼び出しに固有のものではありません。表示される費用は、Vertex AI in Firebase クライアント SDK、Vertex AI サーバー SDK、Firebase Genkit、Gemini API の Firebase Extensions、REST 呼び出し、Vertex AI Studio、その他の API クライアントを使用しているかどうかに関係なく、Vertex AI Gemini API へのすべての呼び出しに関連付けられています。
また、Count Tokens API を使用して、リクエストのトークンサイズと課金対象文字数を見積もることもできます。詳しくは、モデルあたりのトークン数の上限とモデルあたりの料金をご覧ください。
アラートの設定
予期しない請求を回避するには、予算アラートを設定してください。
予算アラートは予算の上限ではありません。アラートは、構成したしきい値に近づいたときやしきい値を超えたときに通知を送信し、アプリやプロジェクトで対応できるようにします。
使用状況やその他の指標をモニタリングする
各 API のプロジェクトの指標(使用状況など)は、Google Cloud コンソールで確認できます。
Google Cloud コンソールで、各 API ページ(Vertex AI API と Vertex AI in Firebase API)に移動します。
Vertex AI API ページ: Vertex AI in Firebase クライアント SDK、Vertex AI サーバー SDK、Firebase Genkit、Gemini API の Firebase Extensions、REST 呼び出し、Vertex AI Studio など、Vertex AI Gemini API へのすべての呼び出しに関連する使用方法です。
Vertex AI in Firebase API ページ: Vertex AI in Firebase SDK からの呼び出しに特化した使用方法です。
[管理] をクリックします。
[指標] タブをクリックします。
プルダウン メニューを使用して、レスポンス コード別のトラフィック、API メソッド別のエラー、全体的なレイテンシ、API メソッド別のレイテンシなど、目的の指標を表示します。