監控 AI 功能的費用、用量和其他指標,是執行正式版應用程式的重要環節。您需要瞭解應用程式的正常用量模式,並確保用量維持在您重視的門檻內。
本頁面說明在 Firebase 控制台和 Google Cloud 控制台中,監控費用、用量和其他指標的建議選項。
監控費用
在 Firebase 控制台的用量和帳單資訊主頁中,您可以查看專案呼叫 Vertex AI Gemini API 和 Gemini Developer API 的費用 (前提是您採用 Blaze 定價方案)。
資訊主頁上顯示的費用「不一定」是使用 Firebase AI Logic 用戶端 SDK 呼叫所產生的費用。顯示的費用與「Gemini API」的任何呼叫相關聯,無論是使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、Genkit、Gemini API 的 Firebase Extensions、REST 呼叫、其中一個 AI Studio,或其他 API 用戶端。
進一步瞭解與使用 Firebase AI Logic 相關聯的產品定價。
設定快訊功能
為避免產生意外費用,請務必在採用 Blaze 定價方案時設定預算快訊。
請注意,預算快訊並非預算上限。當您即將達到或超過設定的門檻時,系統會傳送快訊通知,方便您在應用程式或專案中採取行動。
在 Firebase 控制台中查看 AI 功能的使用情況
您可以在 Firebase 控制台的「Firebase AI Logic」頁面啟用 AI 監控功能,觀察各種應用程式層級的指標和用量,全面掌握來自 Firebase AI Logic 用戶端 SDK 的要求。這些資訊主頁比呼叫 Count Tokens API 取得的基本權杖計數更深入。
Firebase 控制台的 AI 監控主要功能包括:
查看量化指標,例如每個應用程式的要求量、延遲時間、錯誤和每種模式的權杖用量。
檢查追蹤記錄,查看要求屬性、輸入內容和輸出內容,有助於偵錯和提升品質。
依要求狀態、最短延遲時間、模型名稱等維度分割資料。
所有這些功能都是使用 Google Cloud Observability Suite 建構而成 (詳情請參閱下方的產品資訊)。
啟用 AI monitoring
您可以在控制台中透過下列方式啟用 AI 監控:Firebase
你隨時可以前往「設定」Firebase AI Logic分頁
啟用及使用 AI 監控功能的需求條件:
您必須是專案擁有者、編輯者或 Firebase Vertex AI 管理員。
應用程式至少須使用下列 Firebase 程式庫版本:
iOS+:11.13.0 以上版本 | Android:16.0.0 以上版本 (BoM:33.14.0 以上版本) | 網頁:11.8.0 以上版本 | Flutter:2.0.0 以上版本 (BoM:3.11.0 以上版本) | Unity:12.9.0 以上版本應用程式必須啟用選擇加入資料收集功能 (預設為啟用)。
應用程式符合這些規定,且您在管理中心啟用 AI 監控功能後,應用程式或管理中心就不需要進行任何其他操作,即可開始在「AI 監控」Firebase AI Logic分頁的資訊主頁中查看資料。要求中的遙測資料可能需要過一小段時間 (有時最多 5 分鐘),才會顯示在 Firebase 控制台中。
進階用法
本節說明取樣率設定,以及查看和處理資料的不同選項。
取樣率
如果您要提出大量要求,建議您善用取樣率設定。取樣率代表系統會對多少比例的要求收集追蹤記錄詳細資料。
在 Firebase 控制台的「設定」Firebase AI Logic分頁中,您可以將專案的取樣率設為 1 到 100% 的值,其中 100% 代表 AI 監控功能會從所有流量收集追蹤記錄。預設值為 100%。收集的追蹤記錄越少,費用就越低,但可監控的追蹤記錄數量也會減少。請注意,無論取樣率為何,監控資訊主頁中顯示的圖表一律會反映實際流量。
Firebase 控制台以外的其他選項
除了 Firebase 控制台提供的 AI 監控功能,您也可以考慮下列選項:
探索 Vertex AI Model Garden。
這些資訊主頁可進一步深入瞭解受管理模型的延遲和輸送量趨勢,與 Firebase 控制台的 AI 監控深入分析資訊互補。使用 Google Cloud Observability Suite
探索及使用資料 Google Cloud Observability Suite 由於 AI 監控的遙測資料會儲存在與專案相關聯的 Google Cloud Observability Suite 中,因此您可以在資料的資訊主頁中探索資料,包括 Trace Explorer 和 Logs Explorer,這些資訊主頁會在您檢查 Firebase 控制台中的個別追蹤記錄時連結。您也可以使用資料建立自訂資訊主頁、設定快訊等。
用於 AI 監控的產品詳細資訊
AI 監控功能會將遙測資料儲存在 Google Cloud Observability Suite 的各種產品中,包括 Cloud Monitoring、Cloud Trace 和 Cloud Logging。
Cloud Monitoring:儲存指標,包括要求數量、成功率和要求延遲時間。
Cloud Trace:儲存每項要求的追蹤記錄,方便您個別查看詳細資料,而非查看匯總資料。追蹤記錄通常會與記錄檔相關聯,方便您檢查每次互動的內容和時間。
Cloud Logging:擷取輸入、輸出和設定中繼資料,提供 AI 要求各部分的詳細資訊。
由於遙測資料儲存在這些產品中,您可以直接在各產品中指定保留和存取設定 (詳情請參閱 Cloud Monitoring、Cloud Trace 和 Cloud Logging 的說明文件)。請注意,每個取樣要求的實際提示和產生的輸出內容會與指標一併儲存。
定價
採用免付費 Spark 定價方案的專案 (僅在使用 Gemini Developer API 時適用):AI 監控功能使用的基礎服務皆免付費。
採用即付即用 Blaze 定價方案的專案: 系統會根據 AI monitoring 使用的基礎 Google Cloud Observability Suite 產品用量收費 (無論您選擇的 Gemini API 供應商為何)。不過,每項 Google Cloud Observability Suite 產品都有豐富的免付費方案。詳情請參閱Google Cloud Observability Suite定價說明文件。
在 Google Cloud 控制台中查看專案層級的 API 指標
您可以在 Google Cloud 控制台中查看每個 API 的專案層級指標,例如用量。
請注意,本節所述的 Google Cloud 控制台頁面不包含要求和回應內容以及權杖計數等資訊。如要監控這類資訊,建議使用 Firebase 控制台中的 AI 監控功能 (請參閱上一節)。
前往 Google Cloud 控制台,找出要查看的 API,然後前往「指標」頁面:
Vertex AI API: 查看與任何要求相關聯的用量, Vertex AI Gemini API。
- 包括使用Firebase AI Logic用戶端 SDK、Google GenAI 伺服器 SDK、Genkit、Firebase ExtensionsGemini API、REST API、Vertex AI Studio 等提出的要求。
Gemini Developer API: 查看與對 Gemini Developer API 提出的任何要求相關聯的用量。
- 包括使用 Firebase AI Logic 用戶端 SDK、Google GenAI 伺服器 SDK、Genkit、Firebase Extensions Gemini API、REST API、Google AI Studio 等提出的要求。
- 這個 API 在 Google Cloud 控制台中的顯示名稱為「Generative Language API」。
如果系統將您帶往 API 的「總覽頁面」,請依序點選「管理」和「指標」分頁標籤。
使用下拉式選單查看感興趣的指標,例如依回應代碼分類的流量、依 API 方法分類的錯誤、整體延遲時間,以及依 API 方法分類的延遲時間。