Métodos Monte Carlo en RL
Muestreo de Trayectorias
Proceso de generación de episodios completos siguiendo una política dada hasta alcanzar un estado terminal. Las trayectorias recolectadas sirven de base para las estimaciones Monte Carlo de los valores de estado o acción.
← Volver