Vertex AI in Firebase 需要兩個不同的 API (各自有其配額):Vertex AI API 和 Vertex AI in Firebase API。
每個 API 都有配額,以每分鐘要求數 (RPM) 為單位計算,具體來說就是「產生內容」要求 (包括串流和非串流)。Vertex AI API 也有每分鐘輸入符記的配額。
本頁面將說明以下內容:
瞭解 Vertex AI API 和 Vertex AI in Firebase API 的配額
在 Google Cloud 控制台中查看配額
您可以在 Google Cloud 說明文件中瞭解配額的一般資訊。
瞭解各個 API 的配額
每個 API 的配額評估方式略有不同,因此可用於不同用途。
瞭解 Vertex AI API 配額
Vertex AI API 配額是根據「產生內容要求」計算,每個模型、每個區域和每分鐘的數量皆有限制。
以下是這些配額 (具體來說是每分鐘要求數和每分鐘輸入符記數) 的部分重要細節:
這些限制適用於專案層級,且使用同一項 Firebase 專案的所有應用程式和 IP 位址均須共用這些限制。
無論是使用 Vertex AI in Firebase 用戶端 SDK、Vertex AI 伺服器 SDK、Firebase Genkit、Gemini Firebase Extensions、REST 呼叫、Vertex AI Studio 或其他 API 用戶端,這些都適用於任何對 Vertex AI Gemini API 的呼叫。
這些值會套用至基礎模型,以及該模型的所有版本、識別碼和調整版本。例如:
對
gemini-1.0-pro
和gemini-1.0-pro-001
的要求,會計為對基礎模型gemini-1.0 pro
的 RPM 配額的兩項要求。對
gemini-1.0-pro-001
的要求,以及對以gemini-1.0-pro-001
為基礎的調整後模型的要求,會計為對基礎模型gemini-1.0-pro
的 RPM 配額的兩個要求。
基本上,您可以將這個 API 的配額視為所有使用者 (在特定地區使用應用程式中依賴特定模型的 AI 功能) 的「總」配額。
這些配額必須足夠高,才能合理容納特定區域中可能存取 AI 功能 (取決於特定模型) 的使用者總數。由於這些是每分鐘配額,因此在某個地區,所有使用者同時使用相同功能的機率相對較低,因此不會耗盡這些配額。但每個應用程式都不同,因此請視情況調整這些配額。
瞭解 Vertex AI in Firebase API 配額
Vertex AI in Firebase API 配額是根據「每位使用者、每個區域、每分鐘」的「產生內容要求」計算。
以下是此配額 (具體來說是每分鐘要求數) 的幾項重要詳細資料:
這項設定會套用至專案層級,並套用至使用該 Firebase 專案的所有應用程式和 IP 位址。
適用於任何透過任何 Vertex AI in Firebase SDK 的呼叫。
預設配額為每位使用者 100 RPM。
請注意,您仍需考量Vertex AI API 的配額限制,尤其是當這些限制低於 100 RPM 時。
您基本上可以將這個 API 的配額視為依賴 Vertex AI in Firebase 的 AI 功能的「每位使用者」配額。
這個配額必須足夠高,才能讓單一使用者合理地存取依賴 Vertex AI in Firebase 的 AI 功能。由於這個 API 是 Vertex AI API 的閘道,您可以使用 Vertex AI in Firebase API 配額,確保沒有單一使用者耗盡您的 Vertex AI API 配額 (這項配額是供所有使用者共用的)。
查看各個 API 的配額
您可以在 Google Cloud 控制台中查看各個 API 的配額。
在 Google Cloud 控制台中,前往所需 API 的頁面:Vertex AI API 或 Vertex AI in Firebase API。
點選「管理」。
在頁面下方,按一下「配額與系統限制」分頁標籤。
篩選表格以顯示感興趣的配額。
請注意,如要建立
Dimension
篩選器,您必須使用篩選器工具,而非只複製貼上下列範例中的值。針對 Vertex AI API:指定功能 (產生內容的要求)、模型名稱和區域。
舉例來說,如要在任何支援的歐盟地區使用 Gemini 1.5 Flash 產生內容要求時查看配額,您的篩選條件會是這樣:
Generate content requests
+Dimension:base_model:gemini-1.5-flash
+Dimension:region:eu
針對 Vertex AI in Firebase API:指定功能 (產生內容的要求) 和區域。
舉例來說,如要查看在任何支援的亞洲地區產生內容要求的使用者人數配額,篩選器會是這個樣子:
Generate content requests
+Dimension:region:asia
請注意,Vertex AI in Firebase API 配額並非以特定模型為依據。此外,
(default)
配額資料列不適用於 Vertex AI in Firebase。
編輯配額或要求提高配額
在正式發布前,如果您收到 429 超出配額的錯誤,可能需要編輯配額或要求提高配額。請務必調整各個 API 的配額 (請參閱本頁稍早的「瞭解各個 API 的配額」一節,瞭解相關注意事項)。
如要編輯配額,您必須具備 serviceusage.quotas.update
權限,該權限預設包含在擁有者和編輯者角色中。
如要編輯配額或要求提高配額,請按照下列步驟操作:
請按照上一節的操作說明查看各 API 的配額。
勾選每個感興趣的配額左側的核取方塊。
在配額列的結尾,按一下三點圖示選單,然後選取「編輯配額」。
在「Quota changes」表單中,執行下列操作:
在「新值」欄位中輸入要增加的配額。
這個配額適用於專案層級,且會與使用該 Firebase 專案的所有應用程式和 IP 位址共用。
填妥表單中任何其他欄位,然後按一下「Done」(完成)。
按一下 [提交要求]。