비율 제한 및 할당량

Gemini API 제공업체를 클릭하여 이 페이지에서 제공업체별 콘텐츠 및 코드를 확인합니다.


비율 제한 (일반적으로 할당량이라고 함)은 지정된 기간 내에 Gemini API에 대해 실행할 수 있는 요청 수를 규제합니다. 이러한 제한은 공정한 사용을 보장하고, 악용을 방지하며, 모든 사용자를 위해 시스템 성능을 유지하는 데 도움이 됩니다.

Firebase AI Logic을 사용하여 GeminiImagen 모델에 요청을 전송할 때 프로젝트의 비율 제한은 선택한 "Gemini API" 제공업체에 따라 다릅니다. Firebase AI Logic 또한 "사용자별" 비율 제한을 설정하는 방법도 제공합니다.

의 비율 제한 보기 Gemini Developer API

할당량을 초과하거나 액세스 중인 모델의 용량이 소진되면 429 오류 메시지 가 표시됩니다.

비율 제한 (할당량) 작동 방식

비율 제한 (할당량)은 다음 네 가지 측정기준으로 측정됩니다.

  • 분당 요청 수 (RPM)
  • 일일 요청 수 (RPD)
  • 분당 토큰 수 (TPM)
  • 일일 토큰 수 (TPD)

사용량은 각 한도에 대해 평가되며, 한도를 초과하면 429 할당량 초과 오류가 발생합니다. 예를 들어 RPM 한도가 20인 경우 TPM 또는 기타 한도를 초과하지 않았더라도 1분 이내에 21개의 요청을 하면 오류가 발생합니다.

비율 제한은 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소에 적용됩니다.

한도는 사용 중인 특정 모델에 따라 다르며 일부 한도는 특정 모델에만 적용됩니다. 예를 들어 분당 이미지 수 (IPM)는 이미지를 생성할 수 있는 모델 (Imagen)에 대해서만 계산되지만 개념적으로 TPM과 유사합니다.

비율 제한은 실험 모델 및 미리보기 모델에 대해 더 제한적입니다.

비율 제한 상향 요청

Gemini Developer API의 '유료 등급'을 사용하는 경우 비율 제한 상향을 요청할 수 있습니다.

'사용자별' 비율 제한 설정

Firebase AI Logic을 사용하려면 선택한 Gemini API 제공업체를 사용 설정해야 하지만 클라이언트 SDK와 Gemini API 제공업체 간의 게이트웨이 역할을 하는 Firebase AI Logic API도 사용 설정해야 합니다. 이 API는 Firebase 프로젝트에서 Firebase AI Logic을(를) 처음 설정할 때 사용 설정됩니다.

Firebase AI Logic API 비율 제한 (할당량)을 앱의 "사용자별" 비율 제한으로 사용할 수 있습니다. 특히 Firebase AI Logic을 사용하는 AI 기능에 대해 사용할 수 있습니다. 이 한도는 AI 기능에 액세스하는 단일 사용자를 적절히 수용하도록 설정해야 하며, 단일 사용자가 모든 사용자가 공유해야 하는 Gemini API 제공업체의 한도를 초과하지 않도록 해야 합니다.

'사용자별' 비율 제한에 관한 세부정보

다음은 Firebase AI Logic API 비율 제한 (할당량), 특히 분당 요청 수 (RPM)에 관한 몇 가지 중요한 세부정보입니다.

  • 사용자별, 리전별, 분당 '콘텐츠 생성 요청'을 기반으로 하며 모델을 기반으로 하지 않습니다.

  • 모든 사용자에게 적용되는 비율 제한입니다. 현재 특정 사용자 또는 특정 사용자 그룹*에 대한 비율 제한을 설정하는 방법은 없습니다.

  • 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소에 적용됩니다.

  • 모든 Firebase AI Logic SDK에서 직접 발생하는 모든 호출에 적용됩니다.

  • 기본 비율 제한은 사용자당 100RPM입니다.
    Firebase AI 로직 API보다 우선하는 Firebase AI Logic API 제공업체의 한도 (위 참고)도 고려해야 합니다. Gemini API

* Vertex AI Gemini API를 사용하고 앱에서 사용자를 여러 리전으로 안내하는 경우 (예: Firebase Remote Config 사용) 특정 리전의 사용자에 대해 특정 비율 제한을 설정할 수 있습니다. Vertex AI Gemini API

'사용자별' 비율 제한 조정

비율 제한 (할당량)을 조정하려면 소유자 및 편집자 역할에 기본적으로 포함된 serviceusage.quotas.update 권한이 있어야 합니다.

비율 제한 (할당량)을 수정하거나 상향을 요청하는 방법은 다음과 같습니다.

  1. Google Cloud 콘솔에서 Firebase AI Logic API 페이지로 이동합니다.

  2. 관리 를 클릭합니다.

  3. 페이지 하단에서 할당량 및 시스템 한도 탭을 클릭합니다.

  4. 테이블을 필터링하여 기능(콘텐츠 생성 요청) 및 리전과 같은 관심 있는 할당량을 표시합니다.

    예를 들어 지원되는 아시아 리전에서 콘텐츠 생성 요청 에 대한 사용자별 할당량을 보려면 필터가 다음과 비슷하게 표시됩니다. Generate content requests + Dimension:region:asia

  5. 관심 있는 각 할당량 왼쪽에 있는 체크박스를 선택합니다.

  6. 할당량 행 끝에 있는 을 클릭한 후 할당량 수정을 선택합니다.

  7. 할당량 변경 양식에서 다음을 수행합니다.

    1. 새 값 필드에 상향된 할당량을 입력합니다.

      이 할당량은 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소에 공유됩니다.

    2. 양식의 추가 필드를 작성한 후 완료 를 클릭합니다.

    3. 요청 제출 을 클릭합니다.