Cuenta tokens y caracteres facturables para modelos de Gemini

Los modelos generativos dividen los datos en unidades llamadas tokens para su procesamiento. Cada modelo tiene una cantidad máxima de tokens que puede manejar en una instrucción y una respuesta.

En esta página, se muestra cómo usar la API de Count Tokens para obtener una estimación del recuento de tokens y la cantidad de caracteres facturables para una solicitud a un modelo de Gemini. No hay una API para obtener la estimación de tokens en una respuesta.

Ten en cuenta que la API de Count Tokens no se puede usar para modelos Imagen.

¿Qué información se proporciona en el recuento?

Ten en cuenta lo siguiente sobre el recuento de tokens y caracteres facturables:

  • Cómo contar el total de tokens

    • Este recuento es útil para garantizar que tus solicitudes no superen el período permitido del contexto.

    • El recuento de tokens reflejará el tamaño de todos los archivos (por ejemplo, imágenes) que se proporcionan como parte de la entrada de solicitud. No se registrará la cantidad de imágenes ni la cantidad de segundos de un video.

    • En el caso de todos los modelos Gemini, un token equivale a cerca de 4 caracteres. 100 tokens son entre 60 y 80 palabras en inglés.

  • Cómo contar el total de caracteres facturables

    • Este recuento es útil para comprender y controlar tus costos, ya que, en el caso de Vertex AI, la cantidad de caracteres forma parte del cálculo de precios.

    • El recuento de caracteres facturables reflejará la cantidad de caracteres del texto que se proporciona como parte de la entrada de solicitud.

En el caso de los modelos Gemini más antiguos, los tokens no forman parte del cálculo de precios. Sin embargo, en el caso de los modelos Gemini 2.0, los tokens se usan en el cálculo de precios. Obtén más información sobre los límites de tokens por modelo y los precios por modelo.

Precios y cuotas para el recuento de tokens y caracteres facturables

No se aplican cargos ni restricciones de cuota por usar la API de CountTokens. La cuota máxima para la API de CountTokens es de 3,000 solicitudes por minuto (RPM).

Muestras de código

Entrada de solo texto

Entrada multimodal