Генеративные модели разбивают данные на единицы, называемые токенами , для обработки. Каждая модель имеет максимальное количество токенов , которые она может обработать в приглашении и ответе.
На этой странице показано, как использовать API подсчета токенов, чтобы получить оценку количества токенов и количества оплачиваемых символов для запроса к модели Gemini . Не существует API для получения оценки токенов в ответе .
Обратите внимание, что API подсчета токенов нельзя использовать для моделей Imagen .
Какая информация содержится в расчете?
Обратите внимание на следующее относительно подсчета токенов и оплачиваемых символов:
Подсчет общего количества жетонов
Этот счетчик помогает убедиться, что ваши запросы не выходят за пределы допустимого контекстного окна.
Количество токенов будет отражать размер всех файлов (например, изображений), которые предоставляются как часть входных данных запроса . Он не будет считать количество изображений или количество секунд в видео.
Для всех моделей Gemini токен эквивалентен примерно 4 символам. 100 токенов — это примерно 60-80 английских слов.
Подсчет общего количества оплачиваемых символов
Этот подсчет полезен для понимания и контроля ваших затрат, поскольку для Vertex AI количество символов является частью расчета цены.
Оплачиваемое количество символов будет отражать количество символов в тексте , предоставленном во входных данных запроса .
Для более старых моделей Gemini токены не учитываются при расчете цены; однако для моделей Gemini 2.0 при расчете цен используются токены. Узнайте больше об ограничениях токенов для каждой модели и ценах на каждую модель .
Цены и квота на подсчет токенов и оплачиваемых символов
За использование API CountTokens
не взимается плата или ограничения по квотам. Максимальная квота для API CountTokens
— 3000 запросов в минуту (RPM).