瞭解及管理配額

Vertex AI in Firebase 需要兩個不同的 API (各自有其配額):Vertex AI API 和 Vertex AI in Firebase API。

每個 API 都有配額,以每分鐘要求數 (RPM) 為單位計算,具體來說就是「產生內容」要求 (包括串流和非串流)。Vertex AI API 也有每分鐘輸入符記的配額。

本頁面將說明以下內容:

您可以在 Google Cloud 說明文件中瞭解配額的一般資訊

瞭解各 API 的配額

每個 API 的配額評估方式略有不同,因此可用於不同用途。

瞭解 Vertex AI API 配額

Vertex AI API 配額是根據「產生內容要求」計算,每個模型、每個區域和每分鐘的數量皆有限制。

以下提供關於這些配額的重要詳細資料 (特別是每分鐘要求數和每分鐘輸入權杖):

  • 這些限制適用於專案層級,且使用同一項 Firebase 專案的所有應用程式和 IP 位址均須共用這些限制。

  • 無論是使用 Vertex AI in Firebase 用戶端 SDK、Vertex AI 伺服器 SDK、Firebase Genkit、Gemini Firebase Extensions、REST 呼叫、Vertex AI Studio 或其他 API 用戶端,這些規則都適用於任何Vertex AI Gemini API 的呼叫。

  • 這些值會套用至基礎模型,以及該模型的所有版本、ID 和調整版本。例如:

    • gemini-1.0-progemini-1.0-pro-001 的要求,會計為對基礎模型 gemini-1.0 pro 的 RPM 配額的兩個要求。

    • 系統會將對 gemini-1.0-pro-001 的要求,以及根據 gemini-1.0-pro-001調整後模型要求,計為基本模型 gemini-1.0-pro 的 RPM 配額的兩項要求。

  • 如要查看各模型和各區域的預設配額,請參閱 Google Cloud 說明文件。

您基本上可以將這個 API 的配額視為所有使用者 (在特定地區使用應用程式中依賴特定模型的 AI 功能) 的「總」配額。

這些配額必須足夠高,才能合理容納特定區域中可能存取 AI 功能 (取決於特定模型) 的使用者總數。由於這些是每分鐘配額,因此在某個地區,所有使用者同時使用相同功能的機率相對較低,因此不會耗盡這些配額。但每個應用程式都不同,請視情況調整這些配額。

瞭解 Vertex AI in Firebase API 配額

Vertex AI in Firebase API 配額是根據「每位使用者、每個區域、每分鐘」的「產生內容要求」計算。

以下是此配額 (具體來說是每分鐘要求次數) 的部分重要細節:

  • 這項設定會套用至專案層級,並套用至使用該 Firebase 專案的所有應用程式和 IP 位址。

  • 適用於任何透過任何 Vertex AI in Firebase SDK 的呼叫。

  • 預設配額為每位使用者 100 RPM。
    請注意,您仍需考量Vertex AI API 的配額限制,尤其是當這些限制低於 100 RPM 時。

基本上,您可以將這個 API 的配額視為「每位使用者」的配額,以便使用仰賴 Vertex AI in Firebase 的 AI 功能。

這個配額必須足夠高,才能讓單一使用者合理地存取依賴 Vertex AI in Firebase 的 AI 功能。由於這個 API 是 Vertex AI API 的閘道,您可以使用 Vertex AI in Firebase API 配額,確保沒有單一使用者耗盡您的 Vertex AI API 配額 (這項配額是供所有使用者共用的)。

查看各個 API 的配額

您可以在 Google Cloud 控制台中查看各個 API 的配額。

  1. Google Cloud 控制台中,前往感興趣的 API 頁面:Vertex AI APIVertex AI in Firebase API

  2. 點選「管理」

  3. 在頁面下方,按一下「Quotas & System Limits」分頁標籤。

  4. 篩選表格以顯示感興趣的配額。

    請注意,如要建立 Dimension 篩選器,您必須使用篩選器工具,而非只複製貼上下列範例中的值。

    • Vertex AI API:指定功能 (產生內容的要求)、模型名稱和地區。

      舉例來說,如要在任何支援的歐盟地區使用 Gemini 1.5 Flash 產生內容要求時查看配額,您的篩選條件會是這個樣子:
      Generate content requests + Dimension:base_model:gemini-1.5-flash + Dimension:region:eu

    • 針對 Vertex AI in Firebase API:指定功能 (產生內容的要求) 和區域。

      舉例來說,如要查看在任何支援的亞洲地區產生內容要求的使用者人數配額,篩選器會是這個樣子:
      Generate content requests + Dimension:region:asia

      請注意,Vertex AI in Firebase API 配額並非以特定模型為依據。此外,(default) 配額資料列不適用於 Vertex AI in Firebase

編輯配額或申請提高配額

在正式發布前,如果您收到 429 超出配額的錯誤,可能需要編輯配額或要求提高配額。請務必調整各個 API 的配額 (如需考量事項,請參閱本頁稍早的「瞭解各個 API 的配額」一節)。

如要編輯配額,您必須具備 serviceusage.quotas.update 權限,該權限預設包含在擁有者和編輯者角色中。

如要編輯配額或要求提高配額,請按照下列步驟操作:

  1. 請按照上一節的操作說明查看各 API 的配額

  2. 勾選每個感興趣的配額左側的核取方塊。

  3. 在配額列的結尾,按一下三點圖示選單,然後選取「編輯配額」

  4. 在「Quota changes」表單中,執行下列操作:

    1. 在「新值」欄位中輸入要增加的配額。

      這個配額適用於專案層級,且會與使用該 Firebase 專案的所有應用程式和 IP 位址共用。

    2. 填妥表單中任何其他欄位,然後按一下「Done」(完成)。

    3. 按一下 [提交要求]