Les modèles d'IA générative (comme les modèles Gemini) décomposent les données en unités appelées jetons pour le traitement. Chaque modèle Gemini possède un nombre maximal de jetons qu'il peut gérer dans une requête et une réponse.
Cette page explique comment obtenir une estimation du nombre de jetons et du nombre de caractères facturables pour une requête.
Quelles informations sont fournies dans le décompte ?
Notez les points suivants concernant le comptage des jetons et des caractères facturables:
Compter le nombre total de jetons
Ce nombre est utile pour vous assurer que vos requêtes ne dépassent pas la fenêtre de contexte autorisée.
Le nombre de jetons reflète la taille de tous les fichiers (images, par exemple) fournis dans l'entrée de la requête. Il ne compte pas le nombre d'images ni le nombre de secondes d'une vidéo.
Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. 100 jetons correspondent à environ 60-80 mots en anglais.
Compter le nombre total de caractères facturables
Ce nombre est utile pour comprendre et contrôler vos coûts, car pour Vertex AI, le nombre de caractères fait partie du calcul des tarifs.
Le nombre de caractères facturables reflète le nombre de caractères du texte fourni dans l'entrée request.
Pour Vertex AI, les jetons ne sont pas pris en compte dans le calcul du prix. En savoir plus sur les limites de jetons par modèle et les tarifs par modèle
Tarifs et quotas pour le comptage des jetons et des caractères facturables
L'utilisation de l'API CountTokens
n'entraîne aucuns frais ni aucune restriction de quota. Le quota maximal pour l'API CountTokens
est de 3 000 requêtes par minute.