The latest Gemini models, like Gemini 3.5 Flash, are available to use with Firebase AI Logic! Learn more.

All Imagen models will shut down as early as June 30, 2026. Learn about migrating your apps to use Nano Banana.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Tokens für Gemini-Modelle zählen

Gemini Modelle verarbeiten Eingaben und Ausgaben in Einheiten, die als Tokens bezeichnet werden.

Tokens können einzelne Zeichen wie z oder ganze Wörter wie cat sein. Lange Wörter werden in mehrere Tokens aufgeteilt. Die Menge aller vom Modell verwendeten Tokens wird als Vokabular bezeichnet und der Prozess der Aufteilung von Text in Tokens als Tokenisierung.

Bei Gemini Modellen entspricht ein Token etwa 4 Zeichen. 100 Tokens entsprechen etwa 60–80 englischen Wörtern.

Jedes Modell hat eine maximale Anzahl von Tokens die in einem Prompt und einer Antwort verarbeitet werden können. Wenn Sie die Anzahl der Tokens in Ihrem Prompt kennen, wissen Sie, ob Sie dieses Limit überschritten haben. Außerdem werden die Kosten einer Anfrage teilweise durch die Anzahl der Eingabe- und Ausgabetokens bestimmt. Daher kann es hilfreich sein, zu wissen, wie Tokens gezählt werden.

Tipp: Wenn Sie die Anzahl der Tokens steuern möchten, die zum Generieren einer Antwort verwendet werden (und damit die Kosten), können Sie in der Konfiguration des Modells die Denkstufe oder das Denkbudget (nur für Gemini 3.x- und Gemini 2.5-Modelle) und die maxOutputTokens (alle Gemini-Modelle) festlegen.

Unterstützte Modelle

gemini-3.1-pro-preview
gemini-3.5-flash
gemini-3.1-flash-lite
gemini-3-pro-image (auch bekannt als „Nano Banana Pro“)
gemini-3.1-flash-image (auch bekannt als „Nano Banana 2“)
gemini-3.1-flash-lite-image (auch bekannt als „Nano Banana 2 Lite“)
gemini-2.5-pro
gemini-2.5-flash
gemini-2.5-flash-lite

Optionen zum Zählen von Tokens

Alle Ein- und Ausgaben für die Gemini API werden tokenisiert, einschließlich Text, Bild dateien und anderer nicht textbasierter Modalitäten. Hier sind die Optionen zum Zählen von Tokens:

Zählen Sie die Tokens nur für Ihre Anfragen (bevor Sie sie an das Modell senden).

Rufen Sie countTokens mit der Eingabe der Anfrage auf, bevor Sie sie an das Modell senden. Folgendes wird zurückgegeben:

total_tokens: Anzahl der Tokens nur der Eingabe

Zählen Sie die Tokens für Ihre Anfragen und Antworten.

Greifen Sie auf das Attribut usageMetadata des Antwortobjekts zu. Dazu gehören:

prompt_token_count: Anzahl der Tokens der Eingabe
candidates_token_count: Anzahl der Tokens der Ausgabe (ohne Denk-Tokens)
thoughts_token_count: Anzahl der Denk-Tokens die zum Generieren der Antwort verwendet wurden
total_token_count: Gesamtzahl der Tokens für sowohl die Eingabe als auch die Ausgabe (einschließlich aller Denk-Tokens)

Bei der Streaming-Ausgabe wird das usageMetadata Attribut nur im letzten Chunk des Streams angezeigt. Bei Zwischen-Chunks ist es nil für Zwischen-Chunks.

Beachten Sie die folgenden Punkte zu den oben genannten Optionen:

Die Anzahl der Eingabebilder oder die Anzahl der Sekunden in Video- oder Audioeingabedateien wird nicht gezählt. Die Anzahl der Tokens für jede dieser Modalitäten korreliert jedoch mit diesen Werten.
Die Anzahl der Eingabetokens umfasst den Prompt (Text und alle Eingabedateien) sowie alle Systemanweisungen und Tools.
Die Anzahl der Ausgabetokens enthält keine Denk-Tokens. Diese werden in einem separaten Feld angegeben.
Weitere Informationen zu den einzelnen Anfragetypen finden Sie weiter unten auf dieser Seite.
Gemini Live API Modelle unterstützen nicht countTokens. Außerdem wird das Attribut usageMetadata in der Antwort von Live API Modellen von Firebase AI Logic noch nicht unterstützt, aber das wird bald der Fall sein.

Preise für diese Optionen

Aufruf von countTokens: Für den Aufruf von countTokens (der Count Tokens API) fallen keine Gebühren an. Das maximale Kontingent für die Count Tokens API beträgt 3.000 Anfragen pro Minute.
Verwendung des Attributs usageMetadata: Dieses Attribut wird immer als Teil der Antwort zurückgegeben und verursacht keine Tokens oder Gebühren.

Weitere Informationen

Hier finden Sie weitere Informationen zur Verwendung bestimmter Anfragetypen.

Tokens für Texteingaben zählen

Keine weiteren Informationen.

Tokens für Unterhaltungen (Chats) zählen

Beachten Sie beim Aufruf von countTokens in Chats Folgendes:

Wenn Sie countTokens mit dem Chatverlauf aufrufen, wird die Gesamtzahl der Tokens aus beiden Rollen im Chat zurückgegeben (total_tokens).
Wenn Sie wissen möchten, wie groß Ihre nächste Unterhaltung sein wird, müssen Sie sie beim Aufruf von countTokens an den Verlauf anhängen.

Tokens für multimodale Eingaben zählen

Beachten Sie beim Zählen von Tokens mit multimodalen Eingaben Folgendes:

Optional können Sie countTokens für den Text und die Datei separat aufrufen.
Bei beiden Optionen zum Zählen von Tokens erhalten Sie die gleiche Anzahl von Tokens, unabhängig davon, ob Sie die Datei als Inline-Daten oder über ihre URL angeben.

Bild-Eingabedateien

Bild-Eingabedateien werden anhand ihrer Abmessungen in Tokens umgewandelt:

Bildeingaben mit beiden Abmessungen kleiner oder gleich 384 Pixel: Jedes Bild wird als 258 Tokens gezählt.
Bildeingaben, die in einer oder beiden Abmessungen größer sind: Jedes Bild wird nach Bedarf zugeschnitten und auf 768 × 768 Pixel skaliert. Jede Kachel wird dann als 258 Tokens gezählt.

Video- und Audioeingabedateien

Video- und Audioeingabedateien werden zu den folgenden festen Raten in Tokens umgewandelt:

Video: 263 Tokens pro Sekunde
Audio: 32 Tokens pro Sekunde

Dokument-Eingabedateien (z. B. PDFs)

PDF-Eingabedateien werden als Bilder behandelt, sodass jede Seite einer PDF-Datei auf die gleiche Weise wie ein Bild tokenisiert wird.

Tokens für Gemini-Modelle zählen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Unterstützte Modelle

Optionen zum Zählen von Tokens

Preise für diese Optionen

Weitere Informationen

Tokens für Texteingaben zählen

Tokens für Unterhaltungen (Chats) zählen

Tokens für multimodale Eingaben zählen

Bild-Eingabedateien

Video- und Audioeingabedateien

Dokument-Eingabedateien (z. B. PDFs)

Tokens für Gemini-Modelle zählen