생성형 모델은 처리를 위해 데이터를 토큰이라는 단위로 분할합니다. 각 모델에는 프롬프트 및 응답에서 처리할 수 있는 최대 토큰 수가 있습니다.
이 페이지에서는 Count Tokens API를 사용하여 Gemini 모델에 대한 요청의 예상 토큰 수와 청구 가능한 문자 수를 가져오는 방법을 보여줍니다. 응답에서 토큰의 추정치를 가져오는 API는 없습니다.
Count Tokens API는 Imagen 모델에 사용할 수 없습니다.
집계에는 어떤 정보가 제공되나요?
토큰 및 청구 가능한 문자 수 계산에 관한 다음 사항에 유의하세요.
총 토큰 수 집계
이 개수는 요청이 허용되는 컨텍스트 창을 초과하지 않도록 하는 데 도움이 됩니다.
토큰 수는 요청 입력의 일부로 제공되는 모든 파일 (예: 이미지)의 크기를 반영합니다. 동영상의 이미지 수 또는 초 수는 집계되지 않습니다.
모든 Gemini 모델에서 토큰은 약 4자(영문 기준)에 해당합니다. 토큰 100개는 영어 단어 약 60~80개에 해당합니다.
총 청구 가능 문자 수 집계
이 수는 Vertex AI의 경우 문자 수가 가격 계산의 일부이므로 비용을 이해하고 관리하는 데 도움이 됩니다.
청구 가능 문자 수는 요청 입력의 일부로 제공된 텍스트의 문자 수를 반영합니다.
이전 Gemini 모델의 경우 토큰은 가격 책정 계산에 포함되지 않습니다. 하지만 Gemini 2.0 모델의 경우 토큰이 가격 책정 계산에 사용됩니다. 모델당 토큰 한도 및 모델당 가격 책정에 대해 자세히 알아보세요.
토큰 및 청구 가능한 문자 수 계산의 가격 및 할당량
CountTokens
API 사용에는 요금 또는 할당량 제한이 없습니다. CountTokens
API의 최대 할당량은 분당 요청 3,000개 (RPM)입니다.