RL Distributionnel Multi-Pas
RL Sensible au Risque
Extension de l'apprentissage par renforcement distributionnel qui optimise des mesures de risque spécifiques (CVaR, variance) plutôt que l'espérance seule.
← Retour