Glosario IA
El diccionario completo de la Inteligencia Artificial
Apprentissage par Renforcement Inverse Batch
Méthode IRL qui apprend à partir d'un ensemble fixe de démonstrations d'experts sans interaction active avec l'environnement.
Apprentissage par Renforcement Inverse Actif
Approche IRL où l'agent sélectionne activement les actions à exécuter pour mieux comprendre la fonction de récompense de l'expert.
Apprentissage par Renforcement Inverse Bayésien
Framework IRL utilisant l'inférence bayésienne pour modéliser l'incertitude sur la fonction de récompense à partir des démonstrations.
Apprentissage par Renforcement Inverse à partir de Préférences
Méthode IRL qui infère les récompenses à partir des comparaisons de préférences entre trajectoires plutôt que des démonstrations complètes.
Apprentissage par Renforcement Inverse Hiérarchique
Approche IRL qui décompose les tâches complexes en sous-tâches hiérarchiques pour apprendre des fonctions de récompense à plusieurs niveaux.
Apprentissage par Renforcement Inverse Multi-agents
Extension de l'IRL aux environnements où plusieurs agents interagissent et doivent apprendre des récompenses collectives ou individuelles.
Apprentissage par Renforcement Inverse Profond
Utilisation de réseaux de neurones profonds pour représenter et apprendre des fonctions de récompense complexes à partir de données de haute dimension.
Apprentissage par Renforcement Inverse Adversarial
Framework IRL utilisant des techniques de jeux adversariaux où le générateur et le discriminateur s'affrontent pour apprendre la récompense.
Apprentissage par Renforcement Inverse avec Apprentissage par Renforcement
Méthode transformant le problème IRL en un problème RL standard où l'agent apprend à maximiser la vraisemblance des démonstrations.
Apprentissage par Renforcement Inverse Semi-supervisé
Approche IRL combinant des démonstrations étiquetées avec des données non étiquetées pour améliorer l'apprentissage des récompenses.
Apprentissage par Renforcement Inverse pour la Robotique
Application spécialisée de l'IRL pour apprendre les comportements robotiques à partir de démonstrations humaines en manipulation et navigation.
Apprentissage par Renforcement Inverse avec Retour d'Utilisateur
Méthode IRL intégrant activement le retour qualitatif des utilisateurs pour raffiner itérativement la fonction de récompense.
Apprentissage par Renforcement Inverse Coopératif
Framework IRL où l'humain et l'IA collaborent activement pour définir et optimiser conjointement les objectifs de récompense.
Apprentissage par Renforcement Inverse pour la Planification
Utilisation de l'IRL pour extraire les objectifs implicites à partir des plans existants afin d'améliorer les futurs systèmes de planification.
Apprentissage par Renforcement Inverse par Maximisation de l'Entropie
Approche IRL privilégiant les solutions de récompense avec une entropie maximale pour éviter le surajustement aux démonstrations.