이 페이지에서는 Gemini API의 할당량 및 가격 책정 구조를 설명합니다. Vertex AI입니다.
리전 및 모델별 할당량
분당 요청 수(RPM) 할당량은 기본 모델과 해당 모델의 모든 버전, 식별자, 조정된 버전에 적용됩니다. 예를 들면 다음과 같습니다.
gemini-1.0-pro
에 대한 요청과gemini-1.0-pro-001
에 대한 요청은 기본 모델의 RPM 할당량에 대해 두 개의 요청으로 계산됨gemini-1.0 pro
입니다.gemini-1.0-pro-001
에 대한 요청 및 다음과 같은 조정된 모델에 대한 요청gemini-1.0-pro-001
기준의 경우 RPM 할당량에서 2개의 요청으로 집계됩니다. 기본 모델인gemini-1.0-pro
입니다.
이러한 할당량은 프로젝트 수준에서 적용되며 애플리케이션 및 해당 Firebase 프로젝트를 사용하는 IP 주소를 관리할 수 있습니다 또한 할당량은 모든 Gemini API 호출에 적용됩니다. Vertex AI in Firebase SDK, 서버 SDK( Gemini Firebase Extensions), REST 호출 또는 Vertex AI Studio입니다.
각 모델의 리전별 할당량 Google Cloud 문서를 참조하세요.
할당량 상향 조정 요청
Vertex AI의 할당량을 상향 조정하려면 다음을 사용하세요. Google Cloud 콘솔에서 할당량 상향 조정을 요청합니다. 할당량에 대해 자세히 알아보려면 할당량 사용을 참조하세요.
가격 책정
Vertex AI의 Gemini API를 사용하려면 Firebase 프로젝트가 사용 사용한 만큼만 지불하는 Blaze 요금제.
모델별 가격 책정 Google Cloud 문서를 참조하세요.