Métodos Actor-Crítico
Value Function
Función matemática estimando el retorno acumulado esperado desde un estado o un par estado-acción, sirviendo como señal de aprendizaje para la crítica en la arquitectura Actor-Critic.
← Volver