التعلم المعزز العميق القائم على النموذج
نموذج العالم
تمثيل عصبي كامل للبيئة يتعلم ديناميكيات النظام والحالات الكامنة والمكافآت في نفس الوقت للسماح للوكيل بالاستدلال في مساحة محاكاة.
← رجوعتمثيل عصبي كامل للبيئة يتعلم ديناميكيات النظام والحالات الكامنة والمكافآت في نفس الوقت للسماح للوكيل بالاستدلال في مساحة محاكاة.
← رجوع