التعلم المعزز العميق القائم على النموذج
نموذج الديناميكية العكسية
نموذج يتعلم استنتاج الإجراء a_t = f^{-1}(s_t, s_{t+1}) الذي أدى من حالة إلى أخرى، مفيد للتعلم بالمحاكاة وتمثيل الإجراءات.
← رجوعنموذج يتعلم استنتاج الإجراء a_t = f^{-1}(s_t, s_{t+1}) الذي أدى من حالة إلى أخرى، مفيد للتعلم بالمحاكاة وتمثيل الإجراءات.
← رجوع