Méthodes Monte Carlo en RL
Trajectory Sampling
Processus de génération d'épisodes complets en suivant une politique donnée jusqu'à atteindre un état terminal. Les trajectoires collectées servent de base pour les estimations Monte Carlo des valeurs d'état ou d'action.
← Retour