監控 Gemini API 的費用、使用情形和其他指標,是執行正式版應用程式的重要環節。請務必瞭解應用程式的正常使用模式,並確保您維持在重要的門檻範圍內。
監控費用
在 Firebase 主控台的用量和帳單資訊主頁中,您可以查看專案呼叫 Vertex AI Gemini API 的費用。
資訊主頁上顯示的費用不一定是透過 Vertex AI in Firebase 用戶端 SDK 的呼叫所產生。顯示的費用與「任何」對 Vertex AI Gemini API 的呼叫相關,無論是使用 Vertex AI in Firebase 用戶端 SDK、Vertex AI 伺服器 SDK、Firebase Genkit、Gemini API 的 Firebase Extensions、REST 呼叫、Vertex AI Studio 或其他 API 用戶端。
您也可以使用 Count Tokens API,預估要求的符記大小和可計費字元。進一步瞭解每個模型的符記限制和每個模型的定價。
設定快訊功能
為避免產生意外帳單,請務必設定預算快訊。
請注意,預算快訊並非預算上限。當您即將或已超過所設定的門檻時,系統會傳送快訊,讓您在應用程式或專案中採取行動。
監控用量和其他指標
您可以在 Google Cloud 主控台中查看專案中每個 API 的指標,例如使用情形。
在 Google Cloud 控制台中,前往各個 API 頁面:Vertex AI API 和 Vertex AI in Firebase API。
Vertex AI API 頁面:這是與任何對 Vertex AI Gemini API 的呼叫相關聯的用法,無論是使用 Vertex AI in Firebase 用戶端 SDK、Vertex AI 伺服器 SDK、Firebase Genkit、Gemini API 的 Firebase Extensions、REST 呼叫、Vertex AI Studio 等。
Vertex AI in Firebase API 頁面:這是 Vertex AI in Firebase SDK 呼叫的專屬用途。
點選「管理」。
按一下「指標」分頁標籤。
使用下拉式選單查看您感興趣的指標,例如依回應代碼區分的流量、依 API 方法區分的錯誤、整體延遲時間,以及依 API 方法區分的延遲時間。