🏠 홈
벤치마크
📊 모든 벤치마크 🦖 공룡 v1 🦖 공룡 v2 ✅ 할 일 목록 앱 🎨 창의적인 자유 페이지 🎯 FSACB - 궁극의 쇼케이스 🌍 번역 벤치마크
모델
🏆 톱 10 모델 🆓 무료 모델 📋 모든 모델 ⚙️ 킬로 코드 모드
리소스
💬 프롬프트 라이브러리 📖 AI 용어 사전 🔗 유용한 링크

AI 용어집

인공지능 완전 사전

162
카테고리
2,032
하위 카테고리
23,060
용어
📂
하위 카테고리

Behavioral Cloning

Apprentissage supervisé où l'agent imite directement les actions d'experts à partir de démonstrations.

13 용어
📂
하위 카테고리

Inverse Reinforcement Learning

Infère la fonction de récompense optimale à partir des comportements d'experts observés.

6 용어
📂
하위 카테고리

Generative Adversarial Imitation Learning

Utilise des réseaux antagonistes pour discriminer entre les actions de l'agent et celles de l'expert.

12 용어
📂
하위 카테고리

Dataset Aggregation (DAgger)

Méthode itérative collectant de nouvelles données d'expert sur les trajectoires de l'agent pour améliorer la politique.

19 용어
📂
하위 카테고리

Reward Learning from Human Feedback

Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.

14 용어
📂
하위 카테고리

Offline Reinforcement Learning

Apprentissage par renforcement utilisant uniquement des datasets fixes sans interaction avec l'environnement.

9 용어
📂
하위 카테고리

Model-Based Imitation Learning

Builds a dynamic model of the environment to accelerate imitation learning.

10 용어
📂
하위 카테고리

Meta-Imitation Learning

Learns to quickly imitate new tasks with only a few demonstrations.

17 용어
📂
하위 카테고리

Hierarchical Imitation Learning

Decomposes complex behaviors into a hierarchy of simpler subtasks to imiter.

10 용어
📂
하위 카테고리

Multi-Modal Imitation Learning

Handles multiple valid solutions for the same task by learning a distribution over actions.

9 용어
📂
하위 카테고리

Self-Imitation Learning

The agent imitates its own successful past actions to improve its current policy.

17 용어
📂
하위 카테고리

Goal-Conditioned Imitation Learning

Learns a policy conditioned by specific objectives to accomplish various tasks.

15 용어
📂
하위 카테고리

Adversarial Inverse Reinforcement Learning

Combine IRL with adversarial learning for a more robust reward estimation.

12 용어
📂
하위 카테고리

Imitation Learning with Partial Observations

Apprentissage par imitation dans des environnements où l'agent n'observe qu'une partie de l'état.

14 용어
📂
하위 카테고리

Curriculum Imitation Learning

Progressive sequence of demonstrations of increasing difficulty to facilitate learning.

14 용어
🔍

결과를 찾을 수 없습니다