Glosario IA
El diccionario completo de la Inteligencia Artificial
Hierarchical Actor-Critic (HAC)
Architecture d'apprentissage par renforcement combinant des acteurs et critiques à multiples niveaux hiérarchiques pour résoudre des tâches complexes par décomposition temporelle.
High-level Policy
Politique de décision située au sommet de la hiérarchie qui sélectionne des sous-objectifs ou des options pour guider les politiques de niveau inférieur.
Low-level Policy
Politique de base dans la hiérarchie qui exécute des actions primitives pour atteindre les sous-objectifs définis par la politique de niveau supérieur.
Subgoal
Objectif intermédiaire défini par un agent de niveau supérieur que les agents de niveau inférieur doivent atteindre pour progresser vers l'objectif final.
Intra-option Policy
Politique qui détermine les actions à exécuter à chaque étape temporelle lorsqu'une option spécifique est active dans le cadre hiérarchique.
Feudal Networks (FuN)
Architecture hiérarchique inspirée du féodalisme où un manager définit des directions de but et des workers exécutent des actions pour atteindre ces buts.
Controller
Agent de niveau inférieur qui exécute des actions primitives pour accomplir les sous-objectifs spécifiés par le méta-contrôleur.
Hierarchical Deep Deterministic Policy Gradient (H-DDPG)
Extension de l'algorithme DDPP intégrant une structure hiérarchique d'acteurs-critiques pour l'apprentissage dans des espaces d'action continus.
Multi-level Actor-Critic
Architecture où chaque niveau hiérarchique possède sa propre paire acteur-critique optimisée pour des horizons temporels différents.
Hierarchical Q-Learning
Variante du Q-learning où les valeurs Q sont calculées à différents niveaux hiérarchiques pour évaluer les options et les actions primitives.
Subtask Decomposition
Processus de division automatique d'une tâche complexe en sous-tâches plus simples et gérables pour l'apprentissage hiérarchique.
End-to-end Hierarchical Learning
Approche où toute la hiérarchie de politiques est entraînée simultanément sans pré-décomposition manuelle des tâches.