मॉडल पैरामीटर को समझना और कॉन्फ़िगर करना


मॉडल को भेजे जाने वाले हर कॉल में पैरामीटर वैल्यू शामिल होती हैं. ये वैल्यू कंट्रोल करती हैं कि मॉडल, रिस्पॉन्स कैसे जनरेट करता है. यह मॉडल, अलग-अलग पैरामीटर वैल्यू के लिए अलग-अलग नतीजे जनरेट कर सकता है. टास्क के लिए सबसे सही वैल्यू पाने के लिए, अलग-अलग पैरामीटर वैल्यू के साथ एक्सपेरिमेंट करें. अलग-अलग मॉडल के लिए उपलब्ध पैरामीटर अलग-अलग हो सकते हैं.

कॉन्फ़िगरेशन को, शुरू की गई Vertex AI सेवा और मॉडल इंस्टेंस के लाइफ़टाइम तक मैनेज किया जाता है. मॉडल कॉन्फ़िगरेशन को अपडेट करने के लिए, मॉडल इंस्टेंस को फिर से शुरू करना होगा.

इस पेज पर आगे बताया गया है कि मॉडल पैरामीटर को कॉन्फ़िगर करने का तरीका क्या है.

हर पैरामीटर की जानकारी

सबसे सामान्य पैरामीटर ये हैं:

इस पेज के नीचे दिए गए सेक्शन में, इनमें से हर पैरामीटर के बारे में जानें.

ज़्यादा से ज़्यादा आउटपुट टोकन

रिस्पॉन्स में जनरेट किए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या. एक टोकन में करीब चार वर्ण होते हैं. करीब 20 शब्दों के 100 टोकन.

छोटे जवाबों के लिए कम वैल्यू और लंबे रिस्पॉन्स के लिए ज़्यादा वैल्यू डालें.

तापमान

तापमान का इस्तेमाल, रिस्पॉन्स जनरेट करने के दौरान सैंपलिंग के लिए किया जाता है. ऐसा तब होता है, जब topP और topK लागू होते हैं. तापमान, टोकन चुनने में रैंडमनेस की डिग्री को कंट्रोल करता है. कम तापमान ऐसे संकेतों के लिए अच्छा होता है जिनके लिए ज़्यादा सारणिक और कम विस्तार से लिखने वाली या क्रिएटिव प्रतिक्रिया की ज़रूरत होती है. वहीं, ज़्यादा तापमान से ज़्यादा अलग-अलग या क्रिएटिव नतीजे मिल सकते हैं. 0 तापमान डिटर्मिनिस्टिक होता है. इसका मतलब है कि सबसे ज़्यादा प्रॉबबिलिटी रिस्पॉन्स को हमेशा चुना जाता है.

ज़्यादातर मामलों में, तापमान को 0.2 से शुरू करके देखें. अगर मॉडल से ऐसा रिस्पॉन्स मिलता है जो बहुत सामान्य है, बहुत छोटा है या मॉडल से फ़ॉलबैक रिस्पॉन्स देता है, तो तापमान बढ़ाकर देखें.

टॉप-के

Top-K, मॉडल के आउटपुट के लिए टोकन चुनने के तरीके को बदलता है. 1 के टॉप-K का मतलब है कि मॉडल के शब्दावली में मौजूद सभी टोकन में से, अगला चुना गया टोकन सबसे ज़्यादा संभावित है (इसे ग्रीडी डिकोडिंग भी कहा जाता है). वहीं, 3 के टॉप-K का मतलब है कि तापमान का इस्तेमाल करके, तीन सबसे संभावित टोकन में से अगला टोकन चुना गया है.

टोकन चुनने के हर चरण के लिए, सबसे ज़्यादा संभावना वाले टॉप-K टोकन का सैंपल लिया जाता है. इसके बाद, टॉप-पी के हिसाब से टोकन को और फ़िल्टर किया जाता है. इसमें तापमान के सैंपल का इस्तेमाल करके, आखिरी टोकन चुना जाता है.

कम बेतरतीब जवाबों के लिए कम मान और ज़्यादा अनियमित जवाबों के लिए ज़्यादा मान तय करें. डिफ़ॉल्ट टॉप-K 40 है.

टॉप-पी

टॉप-P, आउटपुट के लिए टोकन चुनने के तरीके को बदलता है. टोकन, सबसे ज़्यादा (टॉप-K देखें) से लेकर सबसे कम अनुमानित तक चुने जाते हैं. ऐसा तब तक किया जाता है, जब तक कि उनकी प्रॉबबिलिटी का योग, टॉप-P वैल्यू के बराबर न हो जाए. उदाहरण के लिए, अगर टोकन A, B, और C के होने की संभावना 0.3, 0.2, और 0.1 है और टॉप-P वैल्यू 0.5 है, तो मॉडल तापमान का इस्तेमाल करके A या B को अगले टोकन के तौर पर चुनेगा और C को कैंडिडेट के तौर पर शामिल नहीं करेगा.

कम बेतरतीब जवाबों के लिए कम मान और ज़्यादा अनियमित जवाबों के लिए ज़्यादा मान तय करें. डिफ़ॉल्ट टॉप-P 0.95 है.

मॉडल पैरामीटर कॉन्फ़िगर करें