التعلم المعزز العميق القائم على النموذج
نموذج الديناميكية التقدمية
نموذج تنبؤي يتعلم انتقال الحالة s_{t+1} = f(s_t, a_t) لتوقع العواقب المستقبلية للإجراءات في البيئة.
← رجوعنموذج تنبؤي يتعلم انتقال الحالة s_{t+1} = f(s_t, a_t) لتوقع العواقب المستقبلية للإجراءات في البيئة.
← رجوع