Glosario IA
El diccionario completo de la Inteligencia Artificial
Multi-level Policy Optimization
Processus d'optimisation coordonné ajustant les paramètres de plusieurs couches de politiques hiérarchiques en utilisant des gradients synchronisés pour maximiser la récompense globale.
Nested Policy Networks
Architecture de réseaux de neurones où les politiques de bas niveau sont imbriquées dans des politiques de haut niveau, permettant une décomposition hiérarchique des décisions et des actions.
Option Framework
Formalisation mathématique des comportements temporaires étendus dans les hiérarchies, où chaque option combine une politique intra-option, une condition d'initiation et de terminaison.
Sub-policy Selection
Mécanisme par lequel la politique de haut niveau choisit dynamiquement quelle sous-politique activer en fonction de l'état courant et des objectifs à atteindre.
Primitive Actions
Actions fondamentales de plus bas niveau exécutées directement dans l'environnement, constituant les briques de base des comportements complexes construits par la hiérarchie.
Hierarchical Advantage Estimation
Technique d'estimation des avantages tenant compte de la structure hiérarchique, évaluant la contribution de chaque niveau à l'amélioration globale des performances.
Cross-level Gradient Flow
Mécanisme de propagation des gradients à travers les différents niveaux hiérarchiques, assurant une optimisation coordonnée et stable de l'ensemble de l'architecture.
Hierarchical Entropy Regularization
Technique de régularisation appliquant des pénalités d'entropie différenciées selon les niveaux hiérarchiques pour équilibrer exploration et exploitation à chaque échelle.
Multi-timescale Learning
Paradigme d'apprentissage où différents niveaux hiérarchiques opèrent à des échelles temporelles distinctes, permettant une gestion efficace des décisions court et long terme.
Hierarchical Value Functions
Fonctions de valeur structurées hiérarchiquement estimant les rendements attendus à différents niveaux d'abstraction temporelle pour guider l'apprentissage des politiques.