사용량이 각 한도와 비교하여 평가되며, 한도를 초과하면 429 할당량 초과 오류가 발생합니다. 예를 들어 RPM 한도가 20인 경우 TPM 또는 기타 한도를 초과하지 않았더라도 1분 이내에 21개의 요청을 하면 오류가 발생합니다.
비율 제한은 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소에 적용됩니다.
한도는 사용되는 특정 모델에 따라 다르며 일부 한도는 특정 모델에만 적용됩니다. 예를 들어 분당 이미지 수 (IPM)는 이미지를 생성할 수 있는 모델 (Imagen 3)에 대해서만 계산되지만 개념적으로는 TPM과 유사합니다.
실험 모델과 미리보기 모델의 비율 제한이 더 엄격합니다.
비율 제한 상향 요청
Gemini Developer API의 '유료 등급'을 사용하는 경우 속도 제한 증가를 요청할 수 있습니다.
'사용자별' 비율 제한 설정
Firebase AI Logic를 사용하려면 선택한 Gemini API 제공업체가 사용 설정되어 있어야 하지만 Firebase AI Logic API도 사용 설정되어 있어야 합니다. 이 API는 Google 클라이언트 SDK와 Gemini API 제공업체 간의 게이트웨이 역할을 합니다. 이 API는 Firebase 프로젝트에서 Firebase AI Logic를 처음 설정할 때 사용 설정됩니다.
Firebase AI Logic API 비율 제한 (할당량)을 앱의 '사용자별' 비율 제한으로 사용할 수 있습니다. 특히 Firebase AI Logic를 사용하는 AI 기능에 유용합니다. 단일 사용자가 AI 기능에 액세스할 수 있도록 적절하게 이 한도를 설정하는 동시에 단일 사용자가 모든 사용자가 공유하도록 설계된 Gemini API 제공업체의 한도를 초과하지 않도록 해야 합니다.
'사용자별' 비율 제한에 관한 세부정보
다음은 Firebase AI Logic API의 비율 제한 (할당량), 특히 분당 요청 수 (RPM)에 관한 중요한 세부정보입니다.
사용자별, 지역별, 분당 '콘텐츠 생성 요청'을 기반으로 하며 모델을 기반으로 하지 않습니다.
모든 사용자에게 적용되는 비율 제한입니다. 현재 특정 사용자 또는 특정 사용자 그룹의 비율 제한을 설정하는 방법은 없습니다*.
이 한도는 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소에 적용됩니다.
Firebase AI Logic SDK에서 구체적으로 발생하는 모든 호출에 적용됩니다.
기본 비율 제한은 사용자당 100RPM입니다. Firebase AI Logic API보다 우선하는 Gemini API 제공업체의 한도 (위 참고)를 여전히 고려해야 합니다.
*Vertex AI Gemini API을 사용하고 앱에서 사용자를 다른 지역으로 안내하는 경우 (예: Firebase Remote Config 사용) 특정 지역의 사용자에 대해 특정 비율 제한을 설정할 수 있습니다.
'사용자별' 비율 제한 조정
요율 제한 (할당량)을 조정하려면 소유자 및 편집자 역할에 기본적으로 포함된 serviceusage.quotas.update 권한이 있어야 합니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-05(UTC)"],[],[],null,["\u003cbr /\u003e\n\n\n|-------------------------------------------------------------------------------------------------------------------------------------|\n| *Click your Gemini API provider to view provider-specific content and code on this page.* Gemini Developer API Vertex AI Gemini API |\n\n\u003cbr /\u003e\n\n\u003cbr /\u003e\n\nRate limits (commonly called quotas) regulate the number of requests you can\nmake to the Gemini API within a given timeframe. These limits help ensure\nfair usage, protect against abuse, and help maintain system performance for all\nusers.\n\nWhen using Firebase AI Logic to send requests to Gemini and\nImagen models, your project's rate limits depend on your chosen\n\"Gemini API\" provider. Firebase AI Logic also provides a way to\n[set \"per user\" rate limits](#per-user-rate-limits).\n\n[View rate limits for the Gemini Developer API](https://ai.google.dev/gemini-api/docs/rate-limits)\n| The rate limits (like requests per minute (RPM)) that are listed in the documentation are the *maximum* that the Gemini Developer API supports.\n|\n| The *actual maximum quota\n| **available to your Firebase project** and the model that\n| you're using* are dependent on several factors (for example,\n| the standing of your linked Cloud Billing account and capacity of the\n| overall system).\n\nHow rate limits (quotas) work\n\nRate limits (quotas) are measured across four dimensions:\n\n- Requests per minute (RPM)\n- Requests per day (RPD)\n- Tokens per minute (TPM)\n- Tokens per day (TPD)\n\nYour usage is evaluated against each limit, and exceeding any of them will\ntrigger a 429 quota-exceeded error. For example, if your RPM limit is 20, then\nmaking 21 requests within a minute will result in an error, even if you haven't\nexceeded your TPM or other limits.\n\nRate limits are applied at the project-level and apply to all applications and\nIP addresses that use that Firebase project.\n\nLimits vary depending on the specific model being used, and some limits only\napply to specific models. For example, images per minute (IPM) is only\ncalculated for models capable of generating images (Imagen 3), but is\nconceptually similar to TPM.\n\nRate limits are more restricted for experimental and preview models.\n\nRequest a rate limit increase\n\nIf you're on a \"paid tier\" for the Gemini Developer API, then you can\n[request a rate limit increase](https://ai.google.dev/gemini-api/docs/rate-limits#request-rate-limit-increase).\n\nSet \"per user\" rate limits\n\nTo use Firebase AI Logic, your project needs your chosen\nGemini API provider enabled, but you also need the\n[Firebase AI Logic API](https://console.cloud.google.com/apis/library/firebasevertexai.googleapis.com?project=_) enabled,\nwhich acts as a gateway between our client SDKs and your Gemini API\nprovider. This API is enabled for you when you initially set up\nFirebase AI Logic in your Firebase project.\n\n**You can use the Firebase AI Logic API rate limit (quota) as a\n\"per user\" rate limit for your app** , specifically for the AI features that rely\non Firebase AI Logic. You should\n[set this limit](#edit-quota-or-request-quota-increase) to reasonably\naccommodate a single user accessing your AI features, while also ensuring that\nno single user overwhelms the limits of your Gemini API provider (which is\nmeant to be shared by all your users).\n| **Note:** The Firebase AI Logic API rate limit is set quite high by default (100 RPM) to be usable for any app's use case. We recommend that you [adjust this rate limit](#edit-quota-or-request-quota-increase) to meet the actual needs of your app and use case.\n\nDetails about the \"per user\" rate limit\n\nHere are some important details about the Firebase AI Logic API\nrate limits (quotas) -- specifically, requests per minute (RPM):\n\n- It's based on \"Generate content requests\"\n on a per-user per-region per-minute basis, and it's *not* based on model.\n\n- It's the rate limit applied to *all* your users. Currently, there isn't a way\n to set the rate limit for a specific user or\n specific group of users^**\\***^.\n\n- It applies at the project-level and applies to all applications and IP\n addresses that use that Firebase project.\n\n- It applies to any call that specifically comes from any\n Firebase AI Logic SDK.\n\n- The default rate limit is 100 RPM per user. \n\n Note that you still need to consider the\n limits for your Gemini API provider (see above),\n which take precedence over the Firebase AI Logic API.\n\n^**\\*** *If you're using the Vertex AI Gemini API and your\napp directs users to different regions (for example, using\n[Firebase Remote Config](/docs/ai-logic/solutions/remote-config?api=vertex)),\nthen you could set a specific rate limit for users in a specific region.*^\n\nAdjust the \"per user\" rate limit\n\nTo adjust a rate limit (quota), you must have the `serviceusage.quotas.update`\npermission, which is included by default in the Owner and Editor role.\n\nHere's how to edit your rate limit (quota) or request an increase:\n\n1. In the Google Cloud console, go to the page for the\n [Firebase AI Logic API](https://console.cloud.google.com/apis/library/firebasevertexai.googleapis.com?project=_).\n\n2. Click **Manage**.\n\n3. Lower on the page, click the **Quotas \\& System Limits** tab.\n\n4. Filter the table to show the quotas of interest, like the capability\n (requests for generating content) and region.\n\n For example, to view the per-user quotas for generating content requests\n in any of the supported Asian regions, your filter would look similar to\n this:\n `Generate content requests` + `Dimension:region:asia`\n | **Note:** To create a `Dimension` filter, you need to use the filter tooling, rather than just copy-pasting the values in this example above. Also, the `(default)` quota row doesn't apply to Firebase AI Logic.\n5. Select the checkbox to the left of each quota of interest.\n\n6. At the end of the quota's row, click\n more_vert,\n and then select **Edit quota**.\n\n7. In the **Quota changes** form, do the following:\n\n 1. Enter the increased quota in the *New value* field.\n\n This quota applies at the project-level and is shared across\n all applications and IP addresses that use that Firebase project.\n 2. Complete any additional fields in the form, and then click **Done**.\n\n 3. Click **Submit request**."]]