Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Clonage Comportemental
Apprentissage direct d'une politique en minimisant l'erreur entre les actions de l'agent et les démonstrations expertes.
Apprentissage par Renforcement Inverse
Inférence de la fonction de récompense à partir des démonstrations expertes pour ensuite apprendre la politique optimale.
Apprentissage par Imitation Adversarial Génératif
Utilisation de réseaux antagonistes pour distinguer les comportements de l'agent des démonstrations expertes.
Agrégation de Données DAgger
Collecte itérative de données en interrogeant l'expert sur les états visités par la politique actuelle.
Apprentissage par Imitation Hors Ligne
Apprentissage à partir d'un ensemble fixe de démonstrations sans interaction supplémentaire avec l'environnement.
Apprentissage par Imitation en Ligne
Apprentissage continu avec interaction en temps réel et mises à jour basées sur les nouvelles démonstrations.
Imitation par Observation
Apprentissage en observant uniquement les états et trajectoires sans avoir accès aux actions de l'expert.
Apprentissage par Imitation Hiérarchique
Décomposition des tâches complexes en sous-tâches avec apprentissage par imitation à différents niveaux d'abstraction.
Apprentissage par Imitation en Un Seul Tir
Capacité d'imiter une nouvelle tâche après avoir observé une seule démonstration.
Méta-Apprentissage par Imitation
Apprentissage à apprendre rapidement de nouvelles tâches par imitation à travers l'expérience sur plusieurs tâches.
Apprentissage par Imitation Multimodal
Gestion de démonstrations avec plusieurs solutions valides et apprentissage de politiques multimodales.
Imitation avec Observations Partielles
Apprentissage par imitation lorsque les démonstrations ne couvrent que partiellement l'espace des états.