Modele generatywnej AI (takie jak Gemini) rozdzielają dane na jednostki nazywane tokenami na potrzeby przetwarzania. Każdy model Gemini ma maksymalną liczbę tokenów, które może obsłużyć w promptach i odpowiedziach.
Na tej stronie dowiesz się, jak uzyskać szacunkową liczbę tokenów oraz liczbę znaków podlegających rozliczeniu w przypadku żądania.
Jakie informacje zawiera licznik?
Pamiętaj o tych uwagach na temat zliczania tokenów i znaków podlegających rozliczeniu:
Zliczanie łącznej liczby tokenów
Ta liczba pomaga mieć pewność, że Twoje żądania nie przekraczają dozwolonego okna kontekstu.
Liczba tokenów będzie odzwierciedlać rozmiar wszystkich plików (np. obrazów) dostarczanych w danych wejściowych żądania. Nie uwzględnia liczby obrazów ani sekund trwania filmu.
W przypadku wszystkich modeli Gemini token odpowiada około 4 znakom. 100 tokenów składa się z 60–80 angielskich słów.
Zliczanie łącznej liczby płatnych znaków
Ta liczba pomaga zrozumieć koszty i kontrolować je, ponieważ w przypadku Vertex AI liczba znaków jest uwzględniana przy obliczaniu ceny.
Liczba znaków podlegająca rozliczeniu będzie odpowiadać liczbie znaków w tekście podanym w odpowiedzi na żądanie.
W przypadku Vertex AI tokeny nie są uwzględniane przy obliczaniu cen. Dowiedz się więcej o limitach tokenów i cenach dla poszczególnych modeli.
Ceny i limit liczenia tokenów i znaków podlegających rozliczeniu
Korzystanie z interfejsu API CountTokens
nie wiąże się z żadnymi opłatami ani limitami. Maksymalny limit dla interfejsu CountTokens
API to 3000 żądań na minutę.