Apprentissage par Renforcement Imitatif

📂

sous-catégories

Behavioral Cloning

Apprentissage supervisé où l'agent imite directement les actions d'experts à partir de démonstrations.

13 termes

📂

sous-catégories

Inverse Reinforcement Learning

Infère la fonction de récompense optimale à partir des comportements d'experts observés.

6 termes

📂

sous-catégories

Generative Adversarial Imitation Learning

Utilise des réseaux antagonistes pour discriminer entre les actions de l'agent et celles de l'expert.

12 termes

📂

sous-catégories

Dataset Aggregation (DAgger)

Méthode itérative collectant de nouvelles données d'expert sur les trajectoires de l'agent pour améliorer la politique.

19 termes

📂

sous-catégories

Reward Learning from Human Feedback

Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.

14 termes

📂

sous-catégories

Offline Reinforcement Learning

Apprentissage par renforcement utilisant uniquement des datasets fixes sans interaction avec l'environnement.

9 termes

📂

sous-catégories

Model-Based Imitation Learning

Construit un modèle dynamique de l'environnement pour accélérer l'apprentissage par imitation.

10 termes

📂

sous-catégories

Meta-Imitation Learning

Apprend à imiter rapidement de nouvelles tâches avec seulement quelques démonstrations.

17 termes

📂

sous-catégories

Hierarchical Imitation Learning

Décompose les comportements complexes en une hiérarchie de sous-tâches plus simples à imiter.

10 termes

📂

sous-catégories

Multi-Modal Imitation Learning

Gère plusieurs solutions valides pour une même tâche en apprenant une distribution sur les actions.

9 termes

📂

sous-catégories

Self-Imitation Learning

L'agent imite ses propres actions passées réussies pour améliorer sa politique actuelle.

17 termes

📂

sous-catégories

Goal-Conditioned Imitation Learning

Apprend une politique conditionnée par des objectifs spécifiques pour accomplir diverses tâches.

15 termes

📂

sous-catégories

Adversarial Inverse Reinforcement Learning

Combine IRL avec apprentissage adversarial pour une estimation plus robuste des récompenses.

12 termes

📂

sous-catégories

Imitation Learning with Partial Observations

Apprentissage par imitation dans des environnements où l'agent n'observe qu'une partie de l'état.

14 termes

📂

sous-catégories

Curriculum Imitation Learning

Séquence progressive de démonstrations de difficulté croissante pour faciliter l'apprentissage.

14 termes

Glossaire IA

Behavioral Cloning

Inverse Reinforcement Learning

Generative Adversarial Imitation Learning

Dataset Aggregation (DAgger)

Reward Learning from Human Feedback

Offline Reinforcement Learning

Model-Based Imitation Learning

Meta-Imitation Learning

Hierarchical Imitation Learning

Multi-Modal Imitation Learning

Self-Imitation Learning

Goal-Conditioned Imitation Learning

Adversarial Inverse Reinforcement Learning

Imitation Learning with Partial Observations

Curriculum Imitation Learning

Aucun résultat trouvé