Compter les jetons et les caractères facturables

Les modèles d'IA générative (comme les modèles Gemini) décomposent les données en unités appelées jetons pour le traitement. Chaque modèle Gemini dispose d'un nombre maximal de jetons qu'il peut gérer dans une requête et une réponse.

Cette page vous explique comment obtenir une estimation du nombre de jetons et du nombre de caractères facturables pour une requête.

Quelles informations sont fournies dans le décompte ?

Notez les points suivants concernant le comptage des jetons et des caractères facturables:

  • Compter le nombre total de jetons

    • Ce nombre est utile pour vous assurer que vos requêtes ne dépassent pas la fenêtre de contexte autorisée.

    • Le nombre de jetons reflète la taille de tous les fichiers (images, par exemple) fournis dans l'entrée de la requête. Il ne compte pas le nombre d'images ni le nombre de secondes d'une vidéo.

    • Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. 100 jetons correspondent à environ 60-80 mots en anglais.

  • Compter le nombre total de caractères facturables

    • Ce nombre est utile pour comprendre et contrôler vos coûts, car pour Vertex AI, le nombre de caractères fait partie du calcul des tarifs.

    • Le nombre de caractères facturables reflète le nombre de caractères du texte fourni dans l'entrée de la requête.

Pour Vertex AI, les jetons ne sont pas pris en compte dans le calcul du prix. En savoir plus sur les limites de jetons par modèle et les tarifs par modèle

Tarifs et quota pour le comptage des jetons et des caractères facturables

L'utilisation de l'API CountTokens n'implique aucuns frais ni quotas. Le quota maximal pour l'API CountTokens est de 3 000 requêtes par minute.

Exemples de code

Saisie en texte uniquement

Entrée multimodale