जनरेटिव एआई मॉडल (जैसे, Gemini मॉडल), डेटा को प्रोसेस करने के लिए, उसे टोकन नाम की इकाइयों में बांट देते हैं. हर Gemini मॉडल में ज़्यादा से ज़्यादा टोकन होते हैं जिन्हें प्रॉम्प्ट और जवाब में मैनेज किया जा सकता है.
इस पेज पर, किसी अनुरोध के लिए टोकन की संख्या और बिलिंग के लिए ज़रूरी वर्णों की संख्या का अनुमान लगाने का तरीका बताया गया है.
गिनती में कौनसी जानकारी दी जाती है?
टोकन और बिलिंग के लिए ज़रूरी वर्णों की गिनती करने के बारे में इन बातों का ध्यान रखें:
कुल टोकन की गिनती करना
इस गिनती से यह पक्का करने में मदद मिलती है कि आपके अनुरोध, अनुमति वाली कॉन्टेक्स्ट विंडो से ज़्यादा न हों.
टोकन की संख्या से, अनुरोध इनपुट के हिस्से के तौर पर दी गई सभी फ़ाइलों (उदाहरण के लिए, इमेज) का साइज़ पता चलेगा. यह किसी वीडियो में मौजूद इमेज या सेकंड की संख्या नहीं गिनेगा.
सभी Gemini मॉडल के लिए, एक टोकन चार वर्णों के बराबर होता है. 100 टोक़न, अंग्रेज़ी के करीब 60 से 80 शब्दों के बराबर होते हैं.
बिल किए जा सकने वाले कुल वर्णों की गिनती करना
वर्णों की संख्या की जानकारी से, आपको अपनी लागत को समझने और कंट्रोल करने में मदद मिलती है. ऐसा इसलिए है, क्योंकि Vertex AI के लिए, वर्णों की संख्या की जानकारी की मदद से कीमत का हिसाब लगाया जाता है.
बिलिंग के लिए ज़रूरी वर्णों की संख्या, अनुरोध इनपुट के हिस्से के तौर पर दिए गए टेक्स्ट में मौजूद वर्णों की संख्या दिखाएगी.
Vertex AI के लिए, टोकन की कीमत का हिसाब नहीं लगाया जाता. हर मॉडल के लिए टोकन की सीमाओं और हर मॉडल के लिए कीमत के बारे में ज़्यादा जानें.
टोकन और बिलिंग के लायक वर्णों की गिनती के लिए कीमत और कोटा
CountTokens
एपीआई का इस्तेमाल करने के लिए, कोई शुल्क नहीं लिया जाता. साथ ही, कोटा से जुड़ी कोई पाबंदी भी नहीं है. CountTokens
API के लिए, हर मिनट 3,000 अनुरोधों का ज़्यादा से ज़्यादा कोटा है.