Apprentissage par Prédiction de Trajectoires
Prédiction d'état-action
Modèle prédisant directement l'état suivant s(t+1) en fonction de l'état actuel s(t) et de l'action a(t), formant l'équation de transition fondamentale.
← 뒤로