🏠 Beranda
Benchmark
📊 Semua Benchmark 🦖 Dinosaurus v1 🦖 Dinosaurus v2 ✅ Aplikasi To-Do List 🎨 Halaman Bebas Kreatif 🎯 FSACB - Showcase Utama 🌍 Benchmark Terjemahan
Model
🏆 Top 10 Model 🆓 Model Gratis 📋 Semua Model ⚙️ Kilo Code
Sumber Daya
💬 Perpustakaan Prompt 📖 Glosarium AI 🔗 Tautan Berguna

Glosarium AI

Kamus lengkap Kecerdasan Buatan

162
kategori
2.032
subkategori
23.060
istilah
📂
subkategori

Behavioral Cloning

Apprentissage supervisé où l'agent imite directement les actions d'experts à partir de démonstrations.

13 istilah
📂
subkategori

Inverse Reinforcement Learning

Infère la fonction de récompense optimale à partir des comportements d'experts observés.

6 istilah
📂
subkategori

Generative Adversarial Imitation Learning

Utilise des réseaux antagonistes pour discriminer entre les actions de l'agent et celles de l'expert.

12 istilah
📂
subkategori

Dataset Aggregation (DAgger)

Méthode itérative collectant de nouvelles données d'expert sur les trajectoires de l'agent pour améliorer la politique.

19 istilah
📂
subkategori

Reward Learning from Human Feedback

Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.

14 istilah
📂
subkategori

Offline Reinforcement Learning

Apprentissage par renforcement utilisant uniquement des datasets fixes sans interaction avec l'environnement.

9 istilah
📂
subkategori

Model-Based Imitation Learning

Builds a dynamic model of the environment to accelerate imitation learning.

10 istilah
📂
subkategori

Meta-Imitation Learning

Learns to quickly imitate new tasks with only a few demonstrations.

17 istilah
📂
subkategori

Hierarchical Imitation Learning

Decomposes complex behaviors into a hierarchy of simpler subtasks to imiter.

10 istilah
📂
subkategori

Multi-Modal Imitation Learning

Handles multiple valid solutions for the same task by learning a distribution over actions.

9 istilah
📂
subkategori

Self-Imitation Learning

The agent imitates its own successful past actions to improve its current policy.

17 istilah
📂
subkategori

Goal-Conditioned Imitation Learning

Learns a policy conditioned by specific objectives to accomplish various tasks.

15 istilah
📂
subkategori

Adversarial Inverse Reinforcement Learning

Combine IRL with adversarial learning for a more robust reward estimation.

12 istilah
📂
subkategori

Imitation Learning with Partial Observations

Apprentissage par imitation dans des environnements où l'agent n'observe qu'une partie de l'état.

14 istilah
📂
subkategori

Curriculum Imitation Learning

Progressive sequence of demonstrations of increasing difficulty to facilitate learning.

14 istilah
🔍

Tidak ada hasil ditemukan