التعلم المعزز العميق القائم على النموذج
الاستكشاف القائم على النموذج
استراتيجية استكشاف تستخدم عدم اليقين في النموذج لتوجيه الوكيل نحو الحالات التي يكون النموذج أقل ثقة فيها، مما يعزز تعلم تمثيل أكثر اكتمالاً.
← رجوع