风险敏感学习
Distributional Dynamic Programming
Extension de la programmation dynamique qui maintient et propage des distributions de valeurs plutôt que des estimations ponctuelles. Elle permet une planification plus robuste en tenant compte de l'incertitude des transitions et récompenses.
← 返回