AR Distribucional Multipaso
RL Sensible al Riesgo
Extensión del aprendizaje por refuerzo distribucional que optimiza medidas de riesgo específicas (CVaR, varianza) en lugar de solo la esperanza.
← Volver