जनरेटिव मॉडल, डेटा को प्रोसेस करने के लिए, उसे टोकन नाम की यूनिट में बांट देते हैं. हर मॉडल में, ज़्यादा से ज़्यादा टोकन होते हैं. ये टोकन, प्रॉम्प्ट और जवाब में इस्तेमाल किए जा सकते हैं.
इस पेज पर, Count Tokens API का इस्तेमाल करने का तरीका बताया गया है. इससे, Gemini मॉडल के लिए अनुरोध करने पर, टोकन की संख्या और बिलिंग के लायक वर्णों की संख्या का अनुमान लगाया जा सकता है. जवाब में टोकन का अनुमान लगाने के लिए कोई एपीआई नहीं है.
ध्यान दें कि Imagen मॉडल के लिए, Count Tokens API का इस्तेमाल नहीं किया जा सकता.
गिनती में कौनसी जानकारी दी जाती है?
टोकन और बिलिंग के लिए ज़रूरी वर्णों की गिनती करने के बारे में इन बातों का ध्यान रखें:
कुल टोकन की गिनती करना
इस गिनती से यह पक्का करने में मदद मिलती है कि आपके अनुरोध, अनुमति वाली कॉन्टेक्स्ट विंडो से ज़्यादा न हों.
टोकन की संख्या से, अनुरोध इनपुट के हिस्से के तौर पर दी गई सभी फ़ाइलों (उदाहरण के लिए, इमेज) का साइज़ पता चलेगा. यह किसी वीडियो में मौजूद इमेज या सेकंड की संख्या नहीं गिनेगा.
सभी Gemini मॉडल के लिए, एक टोकन चार वर्णों के बराबर होता है. 100 टोक़न, अंग्रेज़ी के करीब 60 से 80 शब्दों के बराबर होते हैं.
बिल किए जा सकने वाले कुल वर्णों की गिनती करना
वर्णों की संख्या की जानकारी से, आपको अपनी लागत को समझने और कंट्रोल करने में मदद मिलती है. ऐसा इसलिए है, क्योंकि Vertex AI के लिए, वर्णों की संख्या की जानकारी की मदद से कीमत का हिसाब लगाया जाता है.
बिलिंग के लिए ज़रूरी वर्णों की संख्या, अनुरोध इनपुट के हिस्से के तौर पर दिए गए टेक्स्ट में वर्णों की संख्या दिखाएगी.
पुराने Gemini मॉडल के लिए, टोकन की कीमत का हिसाब लगाने में नहीं लगाया जाता. हालांकि, Gemini 2.0 मॉडल के लिए, टोकन की कीमत का हिसाब लगाने में टोकन का इस्तेमाल किया जाता है. हर मॉडल के लिए टोकन की सीमाओं और हर मॉडल के लिए कीमत के बारे में ज़्यादा जानें.
टोकन और बिलिंग के लायक वर्णों की गिनती करने के लिए कीमत और कोटा
CountTokens
एपीआई का इस्तेमाल करने के लिए, कोई शुल्क नहीं लिया जाता और कोटा की कोई पाबंदी नहीं होती. CountTokens
API के लिए, हर मिनट 3,000 अनुरोध (आरपीएम) का ज़्यादा से ज़्यादा कोटा है.