Planning by Reinforcement Learning
Épisode de Planification (Planning Episode)
Séquence complète d'interactions entre l'agent et l'environnement depuis un état initial jusqu'à un état terminal, constituant une unité d'apprentissage pour la politique de planification.
← 뒤로