Contar tokens y caracteres facturables


Los modelos de IA generativa (como los de Gemini) dividen los datos en unidades llamadas tokens para su procesamiento. Cada modelo Gemini tiene una cantidad máxima de tokens que puede controlar en un mensaje y una respuesta.

En esta página, se muestra cómo obtener una estimación del recuento de tokens y la cantidad de caracteres facturables para una solicitud.

¿Qué información se proporciona en el recuento?

Ten en cuenta lo siguiente sobre el recuento de tokens y caracteres facturables:

  • Cuenta el total de tokens

    • Este recuento es útil para garantizar que tus solicitudes no pasen por la ventana contextual permitida.

    • El recuento de tokens reflejará el tamaño de todos los archivos (por ejemplo, imágenes) que se proporcionan como parte de la entrada request. No se registrará la cantidad de imágenes ni los segundos de un video.

    • Para todos los modelos de Gemini, un token es equivalente a, aproximadamente, 4 caracteres. 100 tokens son entre 60 y 80 palabras en inglés.

  • Cuenta el total de caracteres facturables

    • Este recuento es útil para comprender y controlar los costos, ya que en Vertex AI, la cantidad de caracteres es parte del cálculo de precios.

    • El recuento de caracteres facturables reflejará el número de caracteres en el texto que se proporciona como parte de la entrada de request.

En Vertex AI, los tokens no forman parte del cálculo de los precios. Obtén más información sobre los límites de tokens por modelo y los precios por modelo.

Precios y cuota para contar los tokens y los caracteres facturables

No se aplican cargos ni restricciones de cuota por usar la API de CountTokens. La cuota máxima para la API de CountTokens es de 3,000 solicitudes por minuto.

Muestras de código

Entrada de solo texto

Entrada multimodal