Apprentissage par Renforcement Imitatif

📂

subkategori

Behavioral Cloning

Apprentissage supervisé où l'agent imite directement les actions d'experts à partir de démonstrations.

13 istilah

📂

subkategori

Inverse Reinforcement Learning

Infère la fonction de récompense optimale à partir des comportements d'experts observés.

6 istilah

📂

subkategori

Generative Adversarial Imitation Learning

Utilise des réseaux antagonistes pour discriminer entre les actions de l'agent et celles de l'expert.

12 istilah

📂

subkategori

Dataset Aggregation (DAgger)

Méthode itérative collectant de nouvelles données d'expert sur les trajectoires de l'agent pour améliorer la politique.

19 istilah

📂

subkategori

Reward Learning from Human Feedback

Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.

14 istilah

📂

subkategori

Offline Reinforcement Learning

Apprentissage par renforcement utilisant uniquement des datasets fixes sans interaction avec l'environnement.

9 istilah

📂

subkategori

Model-Based Imitation Learning

Builds a dynamic model of the environment to accelerate imitation learning.

10 istilah

📂

subkategori

Meta-Imitation Learning

Learns to quickly imitate new tasks with only a few demonstrations.

17 istilah

📂

subkategori

Hierarchical Imitation Learning

Decomposes complex behaviors into a hierarchy of simpler subtasks to imiter.

10 istilah

📂

subkategori

Multi-Modal Imitation Learning

Handles multiple valid solutions for the same task by learning a distribution over actions.

9 istilah

📂

subkategori

Self-Imitation Learning

The agent imitates its own successful past actions to improve its current policy.

17 istilah

📂

subkategori

Goal-Conditioned Imitation Learning

Learns a policy conditioned by specific objectives to accomplish various tasks.

15 istilah

📂

subkategori

Adversarial Inverse Reinforcement Learning

Combine IRL with adversarial learning for a more robust reward estimation.

12 istilah

📂

subkategori

Imitation Learning with Partial Observations

Apprentissage par imitation dans des environnements où l'agent n'observe qu'une partie de l'état.

14 istilah

📂

subkategori

Curriculum Imitation Learning

Progressive sequence of demonstrations of increasing difficulty to facilitate learning.

14 istilah

Glosarium AI

Behavioral Cloning

Inverse Reinforcement Learning

Generative Adversarial Imitation Learning

Dataset Aggregation (DAgger)

Reward Learning from Human Feedback

Offline Reinforcement Learning

Model-Based Imitation Learning

Meta-Imitation Learning

Hierarchical Imitation Learning

Multi-Modal Imitation Learning

Self-Imitation Learning

Goal-Conditioned Imitation Learning

Adversarial Inverse Reinforcement Learning

Imitation Learning with Partial Observations

Curriculum Imitation Learning

Tidak ada hasil ditemukan