التعرّف على مَعلمات النموذج وضبطها


تتضمّن كلّ طلب ترسله إلى نموذج قيم معلَمات تتحكّم في كيفية توليد النموذج للردّ. يمكن أن يُنشئ النموذج نتائج مختلفة لقيم المَعلمات المختلفة. جرِّب قيمًا مختلفة للمَعلمات للحصول على أفضل القيم للمَهمّة. قد تكون المعلمات المتوفرة لنماذج مختلفة مختلفة.

يتم الاحتفاظ بالتهيئة طوال فترة بقاء الجهاز الذي تم إعداده مثيل الخدمة والنموذج Vertex AI. لتعديل إعدادات النموذج، يجب إعادة ضبط مثيل النموذج.

يمكنك الاطّلاع لاحقًا في هذه الصفحة على كيفية ضبط مَعلمات النموذج.

وصف كل مَعلمة

المعلمات الأكثر شيوعًا هي التالية:

يمكنك الاطّلاع على كلّ مَعلمة من هذه المَعلمات في الأقسام التالية من هذه الصفحة.

الحد الأقصى للرموز المميزة للمخرجات

الحد الأقصى لعدد الرموز المميّزة التي يمكن إنشاؤها في الردّ الرمز المميّز هو أربع أحرف تقريبًا. يشير 100 رمز إلى 20 كلمة تقريبًا.

حدِّد قيمة أقل للردود الأقصر وقيمة أعلى للردود الأطول. الردود.

درجة الحرارة

وتُستخدم درجة الحرارة لأخذ العينات أثناء توليد الاستجابة، وهو ما يحدث عند تطبيق topP وtopK. أدوات التحكّم في درجة الحرارة درجة العشوائية في اختيار الرمز. تكون درجات الحرارة المنخفضة مناسبة لطلبات البحث التي تتطلّب إجابة محدّدة أكثر وأقل انفتاحًا أو إبداعًا، في حين يمكن أن تؤدي درجات الحرارة المرتفعة إلى نتائج أكثر تنوعًا أو إبداعًا. تكون درجة الحرارة 0 حتمية، ما يعني أنّه يتم دائمًا اختيار الإجابة ذات الاحتمالية الأعلى.

في معظم حالات الاستخدام، جرِّب البدء بدرجة حرارة تبلغ 0.2. إذا كان النموذج يعرض ردًا عامًا جدًا أو قصيرًا جدًا أو ردًا احتياطيًا، جرِّب زيادة درجة الحرارة.

أهمّ K

يغيّر Top-K طريقة اختيار النموذج للرموز لعرضها. تعني القيمة القصوى لـ "أهم K رمزًا"‏ 1 أنّ الرمز التالي الذي تم اختياره هو الأكثر احتمالًا من بين كل الرموز في مفردات النموذج (يُعرف ذلك أيضًا باسم "فك التشفير الجشع")، في حين تعني القيمة القصوى لـ "أهم K رمزًا"‏ 3 أنّ الرمز التالي يتم اختياره من بين الرموز الثلاثة الأكثر احتمالية باستخدام درجة الحرارة.

في كل خطوة لاختيار الرموز، يتم أخذ عيّنات من أهم K رمزًا ذات الاحتمالات الأكثر ترجيحًا. ثم تتم تصفية الرموز المميزة بشكل أكبر بناءً على أعلى P مع الرمز المميز النهائي المحدد باستخدام عينات درجة الحرارة.

حدِّد قيمة أقل للردود العشوائية الأقل وقيمة أعلى للحصول على المزيد من الردود. إجابات عشوائية. أعلى قيمة تلقائية هي 40.

Top-P

يغيّر الجزء العلوي-P كيفية اختيار النموذج للرموز المميّزة للمخرجات. يتم اختيار الرموز من الأكثر احتمالًا (راجِع top-K) إلى الأقل احتمالًا إلى أن يصبح مجموع احتمالاتها يساوي قيمة top-P. على سبيل المثال، إذا كانت احتمالات ظهور الرموز A وB وC هي ‎0.3 و0.2 و0.1 وكانت قيمة أعلى قيمة لـ P هي 0.5، سيختار النموذج إما A أو B كرمز لاحق باستخدام درجة الحرارة ويستبعد C كأحد المرشّحين.

حدِّد قيمة أقل للحصول على عدد أقل من الردود العشوائية وقيمة أعلى للحصول على عددٍ أكبر من الردود العشوائية. القيمة التلقائية لفئة top-P هي 0.95.

ضبط مَعلمات النموذج