ทําความเข้าใจและกําหนดค่าพารามิเตอร์โมเดล


การเรียกแต่ละรายการที่คุณส่งไปยังโมเดลจะมีค่าพารามิเตอร์ที่ควบคุมวิธีการ โมเดลจะสร้างคำตอบ โมเดลนี้สามารถสร้างผลลัพธ์ที่แตกต่างกันสำหรับ ค่าพารามิเตอร์ต่างๆ ทดลองใช้ค่าพารามิเตอร์ต่างๆ ค่าที่ดีที่สุดสำหรับงานนี้ พารามิเตอร์ที่ใช้ได้กับรูปแบบต่างๆ อาจ แตกต่างกัน

การกำหนดค่าจะคงไว้ตลอดอายุการใช้งานของ บริการและอินสแตนซ์ของโมเดล Vertex AI หากต้องการอัปเดตการกำหนดค่าโมเดล อินสแตนซ์โมเดลจะต้องเริ่มต้นอีกครั้ง

ในส่วนต่อไปของหน้านี้ คุณสามารถเรียนรู้วิธี กำหนดค่าพารามิเตอร์โมเดล

คำอธิบายของแต่ละพารามิเตอร์

พารามิเตอร์ที่ใช้กันมากที่สุดมีดังนี้

ดูข้อมูลเกี่ยวกับพารามิเตอร์แต่ละตัวเหล่านี้ในส่วนต่อไปนี้ของหน้านี้

โทเค็นเอาต์พุตสูงสุด

จำนวนโทเค็นสูงสุดที่สร้างในการตอบกลับได้ โทเค็นคือ ประมาณ 4 อักขระ โทเค็น 100 รายการจะหมายถึงคำประมาณ 20 คำ

ระบุค่าที่ต่ำกว่าสำหรับคำตอบที่สั้นลงและค่าที่สูงกว่าสำหรับคำตอบที่นานกว่า คำตอบ

อุณหภูมิ

อุณหภูมิจะใช้เพื่อการสุ่มตัวอย่างระหว่างการสร้างการตอบสนองซึ่งเกิดขึ้น เมื่อใช้ topP และ topK ตัวควบคุมอุณหภูมิ ระดับการสุ่มในการเลือกโทเค็น อุณหภูมิที่ต่ำลงเหมาะกับ พรอมต์ที่ต้องมีการกำหนดตายตัวมากขึ้น และมีแนวคิดแบบเปิดหรือมีความคิดสร้างสรรค์น้อยกว่า การตอบสนองขณะที่อุณหภูมิที่สูงขึ้นอาจทำให้มีความหลากหลายหรือสร้างสรรค์มากขึ้น ผลลัพธ์ อุณหภูมิ 0 เป็นเชิงกำหนด ซึ่งหมายความว่า ระบบจะเลือกคำตอบที่มีความน่าจะเป็นสูงสุดไว้เสมอ

สำหรับกรณีการใช้งานส่วนใหญ่ ให้ลองเริ่มด้วยอุณหภูมิที่ 0.2 ถ้า โมเดลส่งคืนคำตอบที่กว้างเกินไป สั้นเกินไป หรือโมเดลให้ การตอบสนองสำรอง ลองเพิ่มอุณหภูมิ

ท็อป K

Top-K จะเปลี่ยนวิธีที่โมเดลเลือกโทเค็นเพื่อแสดงผล ท็อป K ของ 1 หมายความว่าโทเค็นที่เลือกถัดไปน่าจะเป็นไปได้มากที่สุดในบรรดาโทเค็นทั้งหมด ในคำศัพท์ของโมเดล (หรือเรียกว่าการถอดรหัสแบบโล่ง) ขณะที่ 3 หมายความว่าจะเลือกโทเค็นถัดไปจากตัวเลือกยอดนิยม 3 รายการ โทเค็นที่เป็นไปได้โดยใช้อุณหภูมิ

สำหรับขั้นตอนการเลือกโทเค็นแต่ละรายการ โทเค็นสูงสุด K ที่มีค่าสูงสุด จะเป็นการสุ่มตัวอย่าง จากนั้นระบบจะกรองโทเค็นเพิ่มเติมโดยอิงตาม Top-P ที่มี โทเค็นสุดท้ายที่เลือกโดยใช้การสุ่มตัวอย่างอุณหภูมิ

ระบุค่าต่ำกว่าสำหรับคำตอบแบบสุ่มน้อยลงและค่าที่สูงขึ้นสำหรับคำตอบที่มากกว่า คำตอบแบบสุ่ม Top-K เริ่มต้นคือ 40

ตัวท็อป-พี

Top-P จะเปลี่ยนวิธีที่โมเดลเลือกโทเค็นเพื่อแสดงผล เลือกโทเค็นแล้ว จากมากที่สุด (ดู top-K) ไปหาความน่าจะเป็นน้อยที่สุดจนถึงผลรวมของความน่าจะเป็น เท่ากับค่า Top-P เช่น ถ้าโทเค็น A, B และ C มีความน่าจะเป็น 0.3, 0.2 และ 0.1 และค่า P-P บนสุดคือ 0.5 โมเดลจะ เลือก A หรือ B เป็นโทเค็นถัดไปโดยใช้อุณหภูมิและยกเว้น C เป็นโทเค็น เป็นตัวเลือก

ระบุค่าต่ำกว่าสำหรับคำตอบแบบสุ่มน้อยลงและค่าที่สูงขึ้นสำหรับคำตอบที่มากกว่า คำตอบแบบสุ่ม Top-P เริ่มต้นคือ 0.95

กำหนดค่าพารามิเตอร์โมเดล