التعلم بالمجموعات النموذجية
تباين المجموعة
مقياس يكمّن تشتت التنبؤات بين النماذج المختلفة في المجموعة، ويخدم كبديل مباشر لعدم اليقين المعرفي في أنظمة التعلم بالتعزيز القائمة على النموذج (Model-Based RL). يكون أعلى في المناطق الأقل استكشافًا في فضاء الحالات.
← رجوع