Stochastic Optimization in RL
Importance Sampling en RL
Technique permettant d'utiliser des données collectées avec une ancienne politique pour entraîner une nouvelle politique, en pondérant les échantillons par le rapport des densités.
← Indietro