AI 词汇表
人工智能完整词典
Dyna-Q学习
结合直接学习和规划的混合算法,使用学习模型生成模拟体验。
蒙特卡洛树搜索规划
使用随机模拟在建模环境中评估未来行动的决策树探索算法
想象学习
使用内部模型进行心理模拟场景以加速学习且无需真实交互的技术。
世界模型
学习环境的压缩表示和过渡模型以在潜在空间中进行规划的架构。
Apprentissage par Ensemble de Modèles
Approche utilisant plusieurs modèles appris pour quantifier l'incertitude et améliorer la robustesse des décisions.
Apprentissage par Différentiation de Modèles
Méthode optimisant directement les politiques en faisant passer les gradients à travers un modèle différentiable de l'environnement.
Apprentissage par Curiosité Model-Based
Système utilisant les erreurs de prédiction du modèle comme signal intrinsèque pour guider l'exploration de l'environnement.
Apprentissage par Hiérarchie Model-Based
Structure multi-niveaux combinant des modèles à différentes échelles temporelles pour une planification efficace sur des horizons longs.
Apprentissage par Prédiction de Trajectoires
Modèles prédictifs apprenant à anticiper les séquences d'états futurs pour évaluer les conséquences des actions avant exécution.
Apprentissage par Transfer Learning Model-Based
Technique transférant les connaissances du modèle entre environnements similaires pour accélérer l'adaptation à de nouvelles tâches.
MuZero
Algorithme avancé apprenant simultanément un modèle de transition, de réaction et de valeur sans connaissance préalable de la dynamique.
Apprentissage par Apprentissage Actif
Stratégie sélectionnant activement les expériences les plus informatives pour améliorer l'efficacité d'apprentissage du modèle.