RL Basado en Modelo Distributional
RL sensible al riesgo
Enfoque de aprendizaje por refuerzo que utiliza información distribucional para optimizar métricas de riesgo como CVaR o la desviación estándar en lugar de solo la esperanza.
← Volver