Regresión Cuantil DRL
Modelado de Distribución de Valor
Técnica que consiste en aproximar la distribución completa de los retornos esperados para cada estado-acción en lugar de solo su esperanza, capturando la incertidumbre y la variabilidad inherentes al entorno.
← Volver