Vertex AI in Firebase 需要兩個不同的 API (各自有其配額):Vertex AI API 和 Vertex AI in Firebase API。
每個 API 都有配額,以每分鐘要求數 (RPM) 為單位計算,具體來說就是「產生內容」要求 (包括串流和非串流)。Vertex AI API 也有每分鐘輸入符記的配額。
本頁面將說明以下內容:
瞭解 Vertex AI API 和 Vertex AI in Firebase API 的配額
在 Google Cloud 控制台中查看配額
您可以在 Google Cloud 說明文件中瞭解配額的一般資訊。
瞭解各 API 的配額
每個 API 的配額評估方式略有不同,因此可用於不同用途。
瞭解 Vertex AI API 配額
Vertex AI API 配額是根據「產生內容要求」計算,每個模型、每個區域和每分鐘的數量皆有限制。
以下提供關於這些配額的重要詳細資料 (特別是每分鐘要求數和每分鐘輸入權杖):
這些限制適用於專案層級,且使用同一項 Firebase 專案的所有應用程式和 IP 位址均須共用這些限制。
無論是使用 Vertex AI in Firebase 用戶端 SDK、Vertex AI 伺服器 SDK、Firebase Genkit、Gemini Firebase Extensions、REST 呼叫、Vertex AI Studio 或其他 API 用戶端,這些規則都適用於任何對 Vertex AI Gemini API 的呼叫。
這些值會套用至基礎模型,以及該模型的所有版本、ID 和調整版本。例如:
對
gemini-1.0-pro
和gemini-1.0-pro-001
的要求,會計為對基礎模型gemini-1.0 pro
的 RPM 配額的兩個要求。系統會將對
gemini-1.0-pro-001
的要求,以及根據gemini-1.0-pro-001
的調整後模型要求,計為基本模型gemini-1.0-pro
的 RPM 配額的兩項要求。
您基本上可以將這個 API 的配額視為所有使用者 (在特定地區使用應用程式中依賴特定模型的 AI 功能) 的「總」配額。
這些配額必須足夠高,才能合理容納特定區域中可能存取 AI 功能 (取決於特定模型) 的使用者總數。由於這些是每分鐘配額,因此在某個地區,所有使用者同時使用相同功能的機率相對較低,因此不會耗盡這些配額。但每個應用程式都不同,請視情況調整這些配額。
瞭解 Vertex AI in Firebase API 配額
Vertex AI in Firebase API 配額是根據「每位使用者、每個區域、每分鐘」的「產生內容要求」計算。
以下是此配額 (具體來說是每分鐘要求次數) 的部分重要細節:
這項設定會套用至專案層級,並套用至使用該 Firebase 專案的所有應用程式和 IP 位址。
適用於任何透過任何 Vertex AI in Firebase SDK 的呼叫。
預設配額為每位使用者 100 RPM。
請注意,您仍需考量Vertex AI API 的配額限制,尤其是當這些限制低於 100 RPM 時。
基本上,您可以將這個 API 的配額視為「每位使用者」的配額,以便使用仰賴 Vertex AI in Firebase 的 AI 功能。
這個配額必須足夠高,才能讓單一使用者合理地存取依賴 Vertex AI in Firebase 的 AI 功能。由於這個 API 是 Vertex AI API 的閘道,您可以使用 Vertex AI in Firebase API 配額,確保沒有單一使用者耗盡您的 Vertex AI API 配額 (這項配額是供所有使用者共用的)。
查看各個 API 的配額
您可以在 Google Cloud 控制台中查看各個 API 的配額。
在 Google Cloud 控制台中,前往感興趣的 API 頁面:Vertex AI API 或 Vertex AI in Firebase API。
點選「管理」。
在頁面下方,按一下「Quotas & System Limits」分頁標籤。
篩選表格以顯示感興趣的配額。
請注意,如要建立
Dimension
篩選器,您必須使用篩選器工具,而非只複製貼上下列範例中的值。Vertex AI API:指定功能 (產生內容的要求)、模型名稱和地區。
舉例來說,如要在任何支援的歐盟地區使用 Gemini 1.5 Flash 產生內容要求時查看配額,您的篩選條件會是這個樣子:
Generate content requests
+Dimension:base_model:gemini-1.5-flash
+Dimension:region:eu
針對 Vertex AI in Firebase API:指定功能 (產生內容的要求) 和區域。
舉例來說,如要查看在任何支援的亞洲地區產生內容要求的使用者人數配額,篩選器會是這個樣子:
Generate content requests
+Dimension:region:asia
請注意,Vertex AI in Firebase API 配額並非以特定模型為依據。此外,
(default)
配額資料列不適用於 Vertex AI in Firebase。
編輯配額或申請提高配額
在正式發布前,如果您收到 429 超出配額的錯誤,可能需要編輯配額或要求提高配額。請務必調整各個 API 的配額 (如需考量事項,請參閱本頁稍早的「瞭解各個 API 的配額」一節)。
如要編輯配額,您必須具備 serviceusage.quotas.update
權限,該權限預設包含在擁有者和編輯者角色中。
如要編輯配額或要求提高配額,請按照下列步驟操作:
請按照上一節的操作說明查看各 API 的配額。
勾選每個感興趣的配額左側的核取方塊。
在配額列的結尾,按一下三點圖示選單,然後選取「編輯配額」。
在「Quota changes」表單中,執行下列操作:
在「新值」欄位中輸入要增加的配額。
這個配額適用於專案層級,且會與使用該 Firebase 專案的所有應用程式和 IP 位址共用。
填妥表單中任何其他欄位,然後按一下「Done」(完成)。
按一下 [提交要求]。