Contar tokens e caracteres faturáveis


Os modelos de IA generativa (como os modelos do Gemini) dividem os dados em unidades chamadas tokens para processamento. Cada modelo do Gemini tem um número máximo de tokens que pode ser processado em um comando e uma resposta.

Nesta página, mostramos como ver uma estimativa da contagem de tokens e o número de caracteres faturáveis para uma solicitação.

Quais informações são fornecidas na contagem?

Observe o seguinte sobre a contagem de tokens e caracteres faturáveis:

  • Como contar o total de tokens

    • Essa contagem é útil para garantir que as solicitações não ultrapassem a janela de contexto permitida.

    • A contagem de tokens vai refletir o tamanho de todos os arquivos (por exemplo, imagens) fornecidos como parte da entrada de request. Ele não conta o número de imagens ou de segundos em um vídeo.

    • Para todos os modelos do Gemini, um token equivale a cerca de quatro caracteres. 100 tokens equivalem aproximadamente a 60-80 palavras em inglês.

  • Como contar o total de caracteres faturáveis

    • Essa contagem é útil para entender e controlar os custos, já que na Vertex AI, o número de caracteres faz parte do cálculo do preço.

    • A contagem de caracteres faturáveis refletirá o número de caracteres no texto fornecido como parte da entrada de request.

Na Vertex AI, os tokens não fazem parte do cálculo do preço. Saiba mais sobre limites de tokens por modelo e preços por modelo.

Preços e cotas para contagem de tokens e caracteres faturáveis

Não há cobrança ou restrição de cota para uso da API CountTokens. A cota máxima para a API CountTokens é de 3.000 solicitações por minuto.

Amostras de código

Entrada somente de texto

Entrada multimodal