Optimización Estocástica en RL
Muestreo por Importancia en RL
Técnica que permite utilizar datos recolectados con una política antigua para entrenar una nueva política, ponderando las muestras por la relación de densidades.
← Volver