Les modèles génératifs décomposent les données en unités appelées jetons pour le traitement. Chaque modèle dispose d'un nombre maximal de jetons qu'il peut gérer dans une requête et une réponse.
Cette page vous explique comment utiliser l'API Count Tokens pour obtenir une estimation du nombre de jetons et du nombre de caractères facturables pour une requête envoyée à un modèle Gemini. Il n'existe pas d'API permettant d'obtenir l'estimation des jetons dans une réponse.
Notez que l'API Count Tokens ne peut pas être utilisée pour les modèles Imagen.
Quelles informations sont fournies dans le décompte ?
Notez les points suivants concernant le comptage des jetons et des caractères facturables:
Compter le nombre total de jetons
Ce nombre est utile pour vous assurer que vos requêtes ne dépassent pas la fenêtre de contexte autorisée.
Le nombre de jetons reflète la taille de tous les fichiers (images, par exemple) fournis dans l'entrée de la requête. Il ne compte pas le nombre d'images ni le nombre de secondes d'une vidéo.
Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. 100 jetons correspondent à environ 60-80 mots en anglais.
Compter le nombre total de caractères facturables
Ce nombre est utile pour comprendre et contrôler vos coûts, car pour Vertex AI, le nombre de caractères fait partie du calcul des tarifs.
Le nombre de caractères facturables reflète le nombre de caractères dans le texte fourni dans l'entrée de la requête.
Pour les anciens modèles Gemini, les jetons ne font pas partie du calcul du prix. Toutefois, pour les modèles Gemini 2.0, les jetons sont utilisés dans le calcul du prix. En savoir plus sur les limites de jetons par modèle et les tarifs par modèle
Tarifs et quota pour le comptage des jetons et des caractères facturables
L'utilisation de l'API CountTokens
n'implique aucuns frais ni quotas. Le quota maximal pour l'API CountTokens
est de 3 000 requêtes par minute (RPM).