Model-Based Deep RL
Forward Dynamics Model
Modèle prédictif apprenant la transition d'état s_{t+1} = f(s_t, a_t) pour anticiper les conséquences futures des actions dans l'environnement.
← Retour