Apprentissage par Renforcement Imitatif

📂

하위 카테고리

Behavioral Cloning

Apprentissage supervisé où l'agent imite directement les actions d'experts à partir de démonstrations.

13 용어

📂

하위 카테고리

Inverse Reinforcement Learning

Infère la fonction de récompense optimale à partir des comportements d'experts observés.

6 용어

📂

하위 카테고리

Generative Adversarial Imitation Learning

Utilise des réseaux antagonistes pour discriminer entre les actions de l'agent et celles de l'expert.

12 용어

📂

하위 카테고리

Dataset Aggregation (DAgger)

Méthode itérative collectant de nouvelles données d'expert sur les trajectoires de l'agent pour améliorer la politique.

19 용어

📂

하위 카테고리

Reward Learning from Human Feedback

Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.

14 용어

📂

하위 카테고리

Offline Reinforcement Learning

Apprentissage par renforcement utilisant uniquement des datasets fixes sans interaction avec l'environnement.

9 용어

📂

하위 카테고리

Model-Based Imitation Learning

Builds a dynamic model of the environment to accelerate imitation learning.

10 용어

📂

하위 카테고리

Meta-Imitation Learning

Learns to quickly imitate new tasks with only a few demonstrations.

17 용어

📂

하위 카테고리

Hierarchical Imitation Learning

Decomposes complex behaviors into a hierarchy of simpler subtasks to imiter.

10 용어

📂

하위 카테고리

Multi-Modal Imitation Learning

Handles multiple valid solutions for the same task by learning a distribution over actions.

9 용어

📂

하위 카테고리

Self-Imitation Learning

The agent imitates its own successful past actions to improve its current policy.

17 용어

📂

하위 카테고리

Goal-Conditioned Imitation Learning

Learns a policy conditioned by specific objectives to accomplish various tasks.

15 용어

📂

하위 카테고리

Adversarial Inverse Reinforcement Learning

Combine IRL with adversarial learning for a more robust reward estimation.

12 용어

📂

하위 카테고리

Imitation Learning with Partial Observations

Apprentissage par imitation dans des environnements où l'agent n'observe qu'une partie de l'état.

14 용어

📂

하위 카테고리

Curriculum Imitation Learning

Progressive sequence of demonstrations of increasing difficulty to facilitate learning.

14 용어

AI 용어집

Behavioral Cloning

Inverse Reinforcement Learning

Generative Adversarial Imitation Learning

Dataset Aggregation (DAgger)

Reward Learning from Human Feedback

Offline Reinforcement Learning

Model-Based Imitation Learning

Meta-Imitation Learning

Hierarchical Imitation Learning

Multi-Modal Imitation Learning

Self-Imitation Learning

Goal-Conditioned Imitation Learning

Adversarial Inverse Reinforcement Learning

Imitation Learning with Partial Observations

Curriculum Imitation Learning

결과를 찾을 수 없습니다