I modelli di IA generativa (come i modelli Gemini) suddividono i dati in unità chiamate token per l'elaborazione. Ogni modello Gemini ha un numero massimo di token che può gestire in un prompt e una risposta.
Questa pagina mostra come ottenere una stima del conteggio dei token e del numero di caratteri fatturabili per una richiesta.
Quali informazioni vengono fornite nel conteggio?
Tieni presente quanto segue sul conteggio dei token e dei caratteri fatturabili:
Conteggio dei token totali
Questo conteggio è utile per assicurarti che le tue richieste non superino la finestra di contesto consentita.
Il conteggio dei token rifletterà le dimensioni di tutti i file (ad esempio le immagini) forniti nell'input della richiesta. Non viene conteggiato il numero di immagini o il numero di secondi di un video.
Per tutti i modelli Gemini, un token equivale a circa 4 caratteri. 100 token corrispondono a circa 60-80 parole in inglese.
Contare il numero totale di caratteri fatturabili
Questo conteggio è utile per comprendere e controllare i costi, poiché per Vertex AI, il numero di caratteri fa parte del calcolo dei prezzi.
Il numero di caratteri fatturabili rifletterà il numero di caratteri nel testo fornito come parte dell'input della richiesta.
Per Vertex AI, i token non fanno parte del calcolo dei prezzi. Scopri di più su limiti di token per modello e prezzi per modello.
Prezzi e quote per il conteggio di token e caratteri fatturabili
Non sono previsti costi o limitazioni di quota per l'utilizzo dell'API CountTokens
. La quota massima per l'API CountTokens
è di 3000 richieste al minuto.