随机不确定性下的规划

Approche où les décisions sont calculées à l'exécution plutôt qu'à l'avance. Elle est adaptée aux environnements dynamiques où l'état futur est difficile à prédire avec précision.

📖

个术语

Arbre de Politique (Policy Tree)

Représentation d'une politique dans un POMDP comme un arbre de décision où les nœuds internes sont des tests d'observation et les feuilles sont des actions à exécuter. Il capture la nature conditionnelle des décisions.

📖

个术语

Échantillonnage de Trajectoire (Trajectory Sampling)

Technique d'approximation pour résoudre les POMDP en explorant un sous-ensemble de trajectoires possibles plutôt que l'espace complet. Elle permet de traiter des problèmes de grande taille.

📖

个术语

Programmation Dynamique Approximative (ADP)

Ensemble de méthodes pour résoudre des problèmes de commande optimale de grande dimension en utilisant des approximations de la fonction de valeur. Elle est essentielle pour les MDP avec des espaces d'états continus.

AI 词汇表

马尔可夫决策过程 (MDP)

部分可观测马尔可夫决策过程 (POMDP)

策略 (Policy)

折扣因子 (Discount Factor)

观测模型 (Observation Model)

值迭代 (Value Iteration)

策略迭代 (Policy Iteration)

鞍点 (Saddle Point)

Planification en Ligne (Online Planning)

Arbre de Politique (Policy Tree)

Échantillonnage de Trajectoire (Trajectory Sampling)

Programmation Dynamique Approximative (ADP)

未找到结果