मॉडल पैरामीटर को समझना और उन्हें कॉन्फ़िगर करना


मॉडल को भेजे जाने वाले हर कॉल में पैरामीटर वैल्यू शामिल होती हैं. इनकी मदद से, यह कंट्रोल किया जाता है कि तो मॉडल जवाब जनरेट करता है. मॉडल, GA4 प्रॉपर्टी के लिए अलग-अलग नतीजे जनरेट कर सकता है पैरामीटर वैल्यू अलग-अलग हैं. अलग-अलग पैरामीटर मानों के साथ प्रयोग करके यह पता लगाएं टास्क के लिए सबसे सही वैल्यू चुनें. अलग-अलग मॉडल के लिए उपलब्ध पैरामीटर अलग-अलग हैं.

कॉन्फ़िगरेशन को शुरू किए जाने की अवधि तक बनाए रखा जाता है Vertex AI की सेवा और मॉडल इंस्टेंस. मॉडल कॉन्फ़िगरेशन को अपडेट करने के लिए, मॉडल इंस्टेंस को फिर से शुरू करना होगा.

इस पेज पर आगे, आपको यह जानकारी मिलेगी कि मॉडल पैरामीटर कॉन्फ़िगर करने का तरीका देखें.

हर पैरामीटर की जानकारी

सबसे सामान्य पैरामीटर ये हैं:

इस पेज के नीचे दिए गए सेक्शन में, इनमें से हर पैरामीटर के बारे में जानें.

ज़्यादा से ज़्यादा आउटपुट टोकन

रिस्पॉन्स में जनरेट किए जा सकने वाले टोकन की ज़्यादा से ज़्यादा संख्या. टोकन है करीब चार वर्ण होने चाहिए. करीब 20 शब्दों के 100 टोकन.

छोटे जवाबों के लिए कम वैल्यू और लंबे समय के लिए ज़्यादा वैल्यू डालें जवाब.

तापमान

इस तापमान का इस्तेमाल प्रतिक्रिया जनरेट करने के दौरान सैंपलिंग के लिए किया जाता है. इसमें यह होता है जब topP और topK लागू होते हैं. तापमान कंट्रोल करने की सुविधा टोकन चुनने में रैंडमनेस कितनी है. कम तापमान इनके लिए अच्छा होता है ऐसे प्रॉम्प्ट जिनके लिए ज़्यादा डेटरमिनिस्टिक, कम ओपन-एंडेड या क्रिएटिव की ज़रूरत होती है जवाब देता है, जबकि ज़्यादा तापमान से ज़्यादा विविधता या क्रिएटिविटी मिलती है नतीजे. 0 का तापमान डिटरमिनिस्टिक होता है. इसका मतलब है कि सबसे ज़्यादा संभावना वाले रिस्पॉन्स को चुना जाता है.

ज़्यादातर मामलों में, तापमान को 0.2 से शुरू करके देखें. अगर आपने मॉडल ऐसा रिस्पॉन्स दिखाता है जो बहुत सामान्य है, बहुत छोटा है या मॉडल फ़ॉलबैक रिस्पॉन्स, तापमान बढ़ाकर देखें.

टॉप-के

Top-K, मॉडल के आउटपुट के लिए टोकन चुनने के तरीके को बदलता है. सबसे बेहतर 1 का मतलब है कि अगले चुने गए टोकन की, सभी टोकन में से सबसे ज़्यादा संभावना है टोकन (इसे ग्रीडी डिकोडिंग भी कहा जाता है), जबकि एक टॉप-K 3 का मतलब है कि अगला टोकन, सबसे ज़्यादा दिए गए तीन टोकन में से चुना गया है तापमान का इस्तेमाल करके संभावित टोकन.

टोकन चुनने के हर चरण के लिए, सबसे ज़्यादा वैल्यू वाले टॉप-K टोकन प्रायिकताओं का सैंपल लिया जाता है. इसके बाद, टॉप-P के हिसाब से टोकन, टेंपरेचर सैंपलिंग का इस्तेमाल करके चुना गया फ़ाइनल टोकन.

कम रैंडम रिस्पॉन्स के लिए कम वैल्यू और ज़्यादा के लिए ज़्यादा वैल्यू तय करें बेतरतीब जवाब दिए जाते हैं. डिफ़ॉल्ट टॉप-K 40 है.

टॉप-पी

टॉप-P, आउटपुट के लिए टोकन चुनने के तरीके को बदलता है. टोकन चुने गए हैं सबसे ज़्यादा (top-K देखें) से लेकर उनकी प्रायिकताओं के योग तक सबसे कम संभावित टॉप-P वैल्यू के बराबर है. उदाहरण के लिए, अगर टोकन A, B, और C में 0.3, 0.2, और 0.1 और टॉप-P की वैल्यू 0.5 है. ऐसा करने पर, मॉडल तापमान का इस्तेमाल करके, A या B को अगले टोकन के तौर पर चुनें. साथ ही, C को उम्मीदवार.

कम रैंडम रिस्पॉन्स के लिए कम वैल्यू और ज़्यादा के लिए ज़्यादा वैल्यू तय करें बेतरतीब जवाब दिए जाते हैं. डिफ़ॉल्ट टॉप-P 0.95 है.

मॉडल पैरामीटर कॉन्फ़िगर करें