التعلم المعزز العميق القائم على النموذج
التحكم التنبئي بالنموذج (MPC)
استراتيجية تحكم تستخدم النموذج المتعلم لتحسين تسلسل الإجراءات المستقبلية على أفق زمني محدود، مع إعادة تقييم الخطة الأمثل باستمرار في كل خطوة زمنية.
← رجوع