Liczenie tokenów i znaków podlegających rozliczeniu

Modele generatywnej AI (takie jak modele Gemini) dzielą dane na jednostki zwane tokenami w celu ich przetwarzania. Każdy model Gemini ma maksymalną liczbę tokenów, które może obsłużyć w promptach i odpowiedziach.

Na tej stronie dowiesz się, jak oszacować liczbę tokenów i liczbę znaków podlegających rozliczeniu w prośbie.

Jakie informacje są podawane w liczbie?

Pamiętaj o tych kwestiach dotyczących zliczania tokenów i znaków podlegających opłacie:

  • Zliczanie łącznej liczby tokenów

    • Ta liczba pomaga upewnić się, że żądania nie przekraczają dozwolonego okna kontekstu.

    • Liczba tokenów będzie odzwierciedlać rozmiar wszystkich plików (np. obrazów), które są dostarczane w ramach danych wejściowych żądania. Nie będzie ona uwzględniać liczby obrazów ani liczby sekund w filmie.

    • W przypadku wszystkich modeli Gemini token odpowiada około 4 znakom. 100 tokenów to około 60–80 słów w języku angielskim.

  • Liczenie łącznej liczby znaków podlegających opłacie

    • Ta liczba jest przydatna do zrozumienia i kontrolowania kosztów, ponieważ w przypadku Vertex AI liczba znaków jest uwzględniana w obliczeniach cen.

    • Liczba znaków podlegających rozliczeniu będzie odpowiadać liczbie znaków w tekście podanym w ramach danych wejściowych żądania.

W przypadku Vertex AI tokeny nie są uwzględniane w obliczeniach cen. Dowiedz się więcej o limitach tokenów na modelcenach na model.

Ceny i limity dotyczące zliczania tokenów i znaków podlegających opłacie

Korzystanie z interfejsu API CountTokens nie wiąże się z opłatami ani ograniczeniami dotyczącymi limitu. Maksymalny limit interfejsu API CountTokens to 3000 żądań na minutę.

Przykładowe fragmenty kodu

Dane wejściowe tylko z tekstem

Dane wejściowe multimodalne