Gemini modelos processam a entrada e a saída em unidades chamadas tokens.
Os tokens podem ser caracteres únicos, como z, ou palavras inteiras, como cat. Palavras longas são divididas em vários tokens. O conjunto de todos os tokens usados pelo modelo é chamado de vocabulário, e o processo de divisão do texto em tokens é chamado de tokenização.
Para os modelos Gemini, um token equivale a cerca de quatro caracteres. 100 tokens equivalem a cerca de 60 a 80 palavras em inglês.
Cada modelo tem um número máximo de tokens que pode ser processado em um comando e uma resposta. Saber a contagem de tokens do comando permite saber se você excedeu esse limite. Além disso, o custo de uma solicitação é determinado em parte pelo número de tokens de entrada e saída. Portanto, saber como contar tokens pode ser útil.
Modelos compatíveis
gemini-3.1-pro-previewgemini-3-flash-previewgemini-3.1-flash-lite-previewgemini-3-pro-image-previewgemini-3.1-flash-image-previewgemini-2.5-progemini-2.5-flashgemini-2.5-flash-litegemini-2.0-flash-001(e o alias atualizado automaticamentegemini-2.0-flash)gemini-2.0-flash-lite-001(e o alias atualizado automaticamentegemini-2.0-flash-lite)
Opções para contar tokens
Todas as entradas e saídas do Gemini API são tokenizadas, incluindo texto, arquivos de imagem e outras modalidades não textuais. Confira as opções para contar tokens:
- Verifique a contagem de tokens apenas das solicitações (antes de enviá-las ao modelo).
- Chame
countTokenscom a entrada da solicitação antes de enviá-la ao modelo. Isso retorna:total_tokens: contagem de tokens apenas da entrada
- Verifique a contagem de tokens das solicitações e respostas.
- Acesse o atributo
usageMetadatano objeto de resposta. Isso inclui:prompt_token_count: contagem de tokens da entradacandidates_token_count: contagem de tokens da saída (não inclui tokens de pensamento)thoughts_token_count: contagem de tokens de pensamento usados para gerar a respostatotal_token_count: contagem total de tokens para ambas as entradas e saídas (inclui tokens de pensamento)
Ao transmitir a saída, o
usageMetadataatributo só aparece no último bloco do stream. Ele énilpara blocos intermediários.
Confira os pontos a seguir sobre as opções acima:
- Elas não contam o número de imagens de entrada ou o número de segundos em arquivos de entrada de áudio ou vídeo. No entanto, a contagem de tokens para cada uma dessas modalidades será correlacionada com esses valores.
- A contagem de tokens de entrada inclui o comando (texto e arquivos de entrada), bem como instruções e ferramentas do sistema.
- A contagem de tokens de saída não inclui tokens de pensamento. Eles são fornecidos em um campo separado.
- Revise as informações adicionais específicas para cada tipo de solicitação mais adiante nesta página.
- Os modelos Gemini Live API não oferecem suporte a
countTokens. Além disso, Firebase AI Logic ainda não oferece suporte ao atributousageMetadatana resposta dos modelos Live API, mas isso será lançado em breve!
Preços dessas opções
Chamada de
countTokens: não há cobrança pela chamada decountTokens(a API Count Tokens). A cota máxima para a API Count Tokens é de 3.000 solicitações por minuto (RPM).Uso do atributo
usageMetadata: esse atributo é sempre retornado como parte da resposta e não gera tokens ou cobranças.
Informações adicionais
Confira algumas informações adicionais ao trabalhar com tipos específicos de solicitações.
Contar tokens de entrada de texto
Nenhuma informação adicional.
Contar tokens multiturno (chat)
Observe o seguinte para chamar countTokens ao usar o chat:
- Se você chamar
countTokenscom o histórico do chat, ele vai retornar a contagem total de tokens de ambas as funções no chat (total_tokens). - Para entender o tamanho da próxima conversa, anexe-a ao histórico ao chamar
countTokens.
Contar tokens de entrada multimodais
Observe os seguintes pontos sobre a contagem de tokens com entrada multimodal:
- Você pode chamar
countTokensno texto e no arquivo separadamente. - Para ambas as opções de contagem de tokens, você vai receber a mesma contagem de tokens, seja fornecendo o arquivo como dados inline ou usando o URL.
Arquivos de entrada de imagem
Os arquivos de entrada de imagem são convertidos em tokens com base nas dimensões:
- Entradas de imagem com ambas as dimensões menores ou iguais a 384 pixels: cada imagem é contada como 258 tokens.
- Entradas de imagem maiores em uma ou ambas as dimensões: cada imagem é cortada e dimensionada conforme necessário em blocos de 768 x 768 pixels, e cada bloco é contado como 258 tokens.
Arquivos de entrada de áudio e vídeo
Os arquivos de entrada de áudio e vídeo são convertidos em tokens nas seguintes taxas fixas:
- Vídeo: 263 tokens por segundo
- Áudio: 32 tokens por segundo
Arquivos de entrada de documentos (como PDFs)
Os arquivos de entrada em PDF são tratados como imagens. Portanto, cada página de um PDF é tokenizada da mesma forma que uma imagem.