|
点击您的 Gemini API 提供商,以查看此页面上特定于提供商的内容和代码。 |
速率限制(通常称为配额)用于规范您在给定时间段内可以向 Gemini API 发出的请求数量。这些限制有助于确保公平使用、防范滥用行为,并帮助所有用户维持系统性能。
使用 Firebase AI Logic 向 Gemini 和 Imagen 模型发送请求时,项目的速率限制取决于您选择的 “Gemini API”提供方。Firebase AI Logic 还提供了一种 设置“每位用户”速率限制的方法。
查看 Gemini Developer API 的速率限制
如果超出配额,或者您访问的模型的容量已用尽,则会收到 429 错误消息 。
速率限制(配额)的运作方式
速率限制(配额)按以下四个维度衡量:
- 每分钟请求数 (RPM)
- 每日请求数 (RPD)
- 每分钟 token 数 (TPM)
- 每日 token 数 (TPD)
系统会根据每个限制评估您的用量,超出任何限制都会触发 429 超出配额错误。例如,如果您的 RPM 限制为 20,那么在一分钟内发出 21 个请求会导致错误,即使您没有超出 TPM 或其他限制也是如此。
速率限制在项目级应用,适用于使用该 Firebase 项目的所有应用和 IP 地址。
限制因所使用的特定模型而异,并且某些限制仅适用于特定模型。例如,每分钟图片数 (IPM) 仅 针对能够生成图片 (Imagen) 的模型计算,但在概念上与 TPM 类似。
对于实验性模型和预览版模型,速率限制更为严格。
申请提高速率限制
如果您使用的是 Gemini Developer API 的“付费层级”,则可以 申请提高速率限制。
设置“每位用户”速率限制
如需使用 Firebase AI Logic,您的项目需要启用您选择的 Gemini API提供商,但您还需要启用 Firebase AI Logic API, 该 API 充当我们的客户端 SDK 与您的 Gemini API 提供商之间的网关。当您在 Firebase 项目中首次设置 Firebase AI Logic时,系统会为您启用此 API。
您可以将 Firebase AI Logic API 速率限制(配额)用作应用的 “每位用户”速率限制,特别是对于依赖于 Firebase AI Logic 的 AI 功能。您应 设置此限制,以便合理地 容纳单个用户访问您的 AI 功能,同时确保 没有单个用户超出您的 Gemini API 提供商的限制(该限制 旨在供所有用户共享)。
有关“每位用户”速率限制的详细信息
以下是有关 Firebase AI Logic API 速率限制(配额)的一些重要详细信息,特别是每分钟请求数 (RPM):
它基于“生成内容请求”,按每位用户、每个区域、每分钟计算,并且 不 基于模型。
它是应用于 所有 用户的速率限制。目前,无法为特定用户或 特定用户群组设置速率限制*。
它在项目级应用,适用于使用该 Firebase 项目的所有应用和 IP 地址。
它适用于专门来自任何 Firebase AI Logic SDK 的任何调用。
默认速率限制为每位用户 100 RPM。
请注意,您仍需考虑 您的 Gemini API 提供商的限制(见上文), 这些限制优先于 Firebase AI Logic API。
* 如果您使用的是 Vertex AI Gemini API,并且您的 应用将用户定向到不同的区域(例如,使用 Firebase Remote Config), 那么您可以为特定区域的用户设置特定的速率限制。
调整“每位用户”速率限制
如需调整速率限制(配额),您必须拥有 serviceusage.quotas.update 权限,该权限默认包含在 Owner 和 Editor 角色中。
以下介绍了如何修改速率限制(配额)或申请提高速率限制:
在 Google Cloud 控制台中,前往 Firebase AI Logic API 的页面。
点击管理 。
在页面下方,点击配额和系统限制 标签页。
过滤表格以显示您感兴趣的配额,例如功能(生成内容的请求)和区域。
例如,如需查看在任何受支持的亚洲区域中生成内容请求的每位用户配额,您的过滤条件将类似于以下内容:
Generate content requests+Dimension:region:asia选中您感兴趣的每个配额左侧的复选框。
在配额行的末尾,点击 , 然后选择 修改配额。
在配额更改 表单中,执行以下操作:
在 新值 字段中输入增加的配额。
此配额在项目级应用,适用于使用该 Firebase 项目的所有应用和 IP 地址。
填写表单中的任何其他字段,然后点击完成 。
点击提交请求 。