RL Basé sur Modèle Distributionnel
RL sensible au risque
Approche d'apprentissage par renforcement qui utilise des informations distributionnelles pour optimiser des métriques de risque comme CVaR ou l'écart-type au lieu de l'espérance seule.
← ফিরে যান