RL ডিস্ট্রিবিউশনাল মাল্টি-পাস
RL Sensible au Risque
Extension de l'apprentissage par renforcement distributionnel qui optimise des mesures de risque spécifiques (CVaR, variance) plutôt que l'espérance seule.
← ফিরে যান