AI 詞彙表
人工智能完整詞典
分布式价值函数
将价值函数建模为完整的分布而不是标量。
分类DQN
一种使用回报分布的离散分类表示的算法。
Quantile Regression DQN
Approche utilisant la régression quantile pour apprendre directement les quantiles de la distribution.
风险敏感学习
使用完整分布来建模风险偏好
Gradient de Politique Distributionnel
Extension des méthodes de gradient de politique aux approches distributionnelles.
Estimation d'Incertitude
Quantification de l'incertitude dans les prédictions via la distribution des retours.
RL Distributionnel Multi-Pas
Extension des méthodes multi-pas au cadre distributionnel pour meilleure stabilité.
RL Distributionnel Continu
Application des méthodes distributionnelles aux espaces d'action continus.
Acteur-Critique Distributionnel
Combinaison des approches distributionnelles avec les méthodes acteur-critique.
RL Basé sur Modèle Distributionnel
Intégration des distributions dans les méthodes d'apprentissage par renforcement basées sur modèle.
RL Hiérarchique Distributionnel
Application des concepts distributionnels aux structures hiérarchiques de décision.
Transfert d'Apprentissage Distributionnel
Utilisation des distributions pour améliorer le transfert de connaissances entre tâches.