Gemini मॉडल के लिए टोकन और बिलिंग के लायक वर्ण की गिनती करना
bookmark_border संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

जनरेटिव मॉडल, डेटा को प्रोसेस करने के लिए, उसे टोकन नाम की यूनिट में बांट देते हैं. हर मॉडल में, ज़्यादा से ज़्यादा टोकन होते हैं. ये टोकन, प्रॉम्प्ट और जवाब में इस्तेमाल किए जा सकते हैं.

इस पेज पर, Count Tokens API का इस्तेमाल करने का तरीका बताया गया है. इससे, Gemini मॉडल के लिए अनुरोध करने पर, टोकन की संख्या और बिलिंग के लायक वर्णों की संख्या का अनुमान लगाया जा सकता है. जवाब में टोकन का अनुमान लगाने के लिए कोई एपीआई नहीं है.

ध्यान दें कि Imagen मॉडल के लिए, Count Tokens API का इस्तेमाल नहीं किया जा सकता.

गिनती में कौनसी जानकारी दी जाती है?

टोकन और बिलिंग के लिए ज़रूरी वर्णों की गिनती करने के बारे में इन बातों का ध्यान रखें:

कुल टोकन की गिनती करना

इस गिनती से यह पक्का करने में मदद मिलती है कि आपके अनुरोध, अनुमति वाली कॉन्टेक्स्ट विंडो से ज़्यादा न हों.

टोकन की संख्या से, अनुरोध इनपुट के हिस्से के तौर पर दी गई सभी फ़ाइलों (उदाहरण के लिए, इमेज) का साइज़ पता चलेगा. यह किसी वीडियो में मौजूद इमेज की संख्या या सेकंड की संख्या नहीं गिनेगा.

सभी Gemini मॉडल के लिए, एक टोकन चार वर्णों के बराबर होता है. 100 टोक़न, अंग्रेज़ी के करीब 60 से 80 शब्दों के बराबर होते हैं.

बिल किए जा सकने वाले कुल वर्णों की गिनती करना

वर्णों की संख्या की जानकारी से, आपको अपनी लागत को समझने और कंट्रोल करने में मदद मिलती है. ऐसा इसलिए है, क्योंकि Vertex AI के लिए, वर्णों की संख्या की जानकारी की मदद से कीमत का हिसाब लगाया जाता है.

बिलिंग के लिए ज़रूरी वर्णों की संख्या, अनुरोध इनपुट के हिस्से के तौर पर दिए गए टेक्स्ट में वर्णों की संख्या दिखाएगी.

पुराने Gemini मॉडल के लिए, टोकन की कीमत का हिसाब लगाने में नहीं लगाया जाता. हालांकि, Gemini 2.0 मॉडल के लिए, टोकन की कीमत का हिसाब लगाने में टोकन का इस्तेमाल किया जाता है. हर मॉडल के लिए टोकन की सीमाओं और हर मॉडल के लिए कीमत के बारे में ज़्यादा जानें.

टोकन और बिलिंग के लायक वर्णों की गिनती करने के लिए कीमत और कोटा

CountTokens API का इस्तेमाल करने के लिए, कोई शुल्क नहीं लिया जाता और कोटा की कोई पाबंदी नहीं होती. CountTokens API के लिए, हर मिनट 3,000 अनुरोध (आरपीएम) का ज़्यादा से ज़्यादा कोटा है.

कोड सैंपल

सिर्फ़ टेक्स्ट वाला इनपुट

मल्टीमोडल इनपुट

क्या इस कॉन्टेंट से आपको मदद मिली?