Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Behavioral Cloning
Apprentissage supervisé où l'agent imite directement les actions d'experts à partir de démonstrations.
Inverse Reinforcement Learning
Infère la fonction de récompense optimale à partir des comportements d'experts observés.
Generative Adversarial Imitation Learning
Utilise des réseaux antagonistes pour discriminer entre les actions de l'agent et celles de l'expert.
Dataset Aggregation (DAgger)
Méthode itérative collectant de nouvelles données d'expert sur les trajectoires de l'agent pour améliorer la politique.
Reward Learning from Human Feedback
Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.
Offline Reinforcement Learning
Apprentissage par renforcement utilisant uniquement des datasets fixes sans interaction avec l'environnement.
Model-Based Imitation Learning
Construit un modèle dynamique de l'environnement pour accélérer l'apprentissage par imitation.
Meta-Imitation Learning
Apprend à imiter rapidement de nouvelles tâches avec seulement quelques démonstrations.
Hierarchical Imitation Learning
Décompose les comportements complexes en une hiérarchie de sous-tâches plus simples à imiter.
Multi-Modal Imitation Learning
Gère plusieurs solutions valides pour une même tâche en apprenant une distribution sur les actions.
Self-Imitation Learning
L'agent imite ses propres actions passées réussies pour améliorer sa politique actuelle.
Goal-Conditioned Imitation Learning
Apprend une politique conditionnée par des objectifs spécifiques pour accomplir diverses tâches.
Adversarial Inverse Reinforcement Learning
Combine IRL avec apprentissage adversarial pour une estimation plus robuste des récompenses.
Imitation Learning with Partial Observations
Apprentissage par imitation dans des environnements où l'agent n'observe qu'une partie de l'état.
Curriculum Imitation Learning
Séquence progressive de démonstrations de difficulté croissante pour faciliter l'apprentissage.