🏠 होम
बेंचमार्क
📊 सभी बेंचमार्क 🦖 डायनासोर v1 🦖 डायनासोर v2 ✅ टू-डू लिस्ट ऐप्स 🎨 रचनात्मक फ्री पेज 🎯 FSACB - अल्टीमेट शोकेस 🌍 अनुवाद बेंचमार्क
मॉडल
🏆 टॉप 10 मॉडल 🆓 मुफ्त मॉडल 📋 सभी मॉडल ⚙️ किलो कोड
संसाधन
💬 प्रॉम्प्ट लाइब्रेरी 📖 एआई शब्दावली 🔗 उपयोगी लिंक

एआई शब्दावली

आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश

179
श्रेणियाँ
1,183
उप-श्रेणियाँ
14,904
शब्द
📂
उप-श्रेणियाँ

Behavioral Cloning

Apprentissage supervisé où l'agent imite directement les actions d'experts à partir de démonstrations.

13 शब्द
📂
उप-श्रेणियाँ

Inverse Reinforcement Learning

Infère la fonction de récompense optimale à partir des comportements d'experts observés.

6 शब्द
📂
उप-श्रेणियाँ

Generative Adversarial Imitation Learning

Utilise des réseaux antagonistes pour discriminer entre les actions de l'agent et celles de l'expert.

12 शब्द
📂
उप-श्रेणियाँ

Dataset Aggregation (DAgger)

Méthode itérative collectant de nouvelles données d'expert sur les trajectoires de l'agent pour améliorer la politique.

19 शब्द
📂
उप-श्रेणियाँ

Reward Learning from Human Feedback

Apprend les récompenses à partir d'évaluations comparatives ou qualitatives fournies par des humains.

14 शब्द
📂
उप-श्रेणियाँ

Offline Reinforcement Learning

Apprentissage par renforcement utilisant uniquement des datasets fixes sans interaction avec l'environnement.

9 शब्द
📂
उप-श्रेणियाँ

Model-Based Imitation Learning

Construit un modèle dynamique de l'environnement pour accélérer l'apprentissage par imitation.

10 शब्द
📂
उप-श्रेणियाँ

Meta-Imitation Learning

Apprend à imiter rapidement de nouvelles tâches avec seulement quelques démonstrations.

17 शब्द
📂
उप-श्रेणियाँ

Hierarchical Imitation Learning

Décompose les comportements complexes en une hiérarchie de sous-tâches plus simples à imiter.

10 शब्द
📂
उप-श्रेणियाँ

Multi-Modal Imitation Learning

Gère plusieurs solutions valides pour une même tâche en apprenant une distribution sur les actions.

9 शब्द
📂
उप-श्रेणियाँ

Self-Imitation Learning

L'agent imite ses propres actions passées réussies pour améliorer sa politique actuelle.

17 शब्द
📂
उप-श्रेणियाँ

Goal-Conditioned Imitation Learning

Apprend une politique conditionnée par des objectifs spécifiques pour accomplir diverses tâches.

15 शब्द
📂
उप-श्रेणियाँ

Adversarial Inverse Reinforcement Learning

Combine IRL avec apprentissage adversarial pour une estimation plus robuste des récompenses.

12 शब्द
📂
उप-श्रेणियाँ

Imitation Learning with Partial Observations

Apprentissage par imitation dans des environnements où l'agent n'observe qu'une partie de l'état.

14 शब्द
📂
उप-श्रेणियाँ

Curriculum Imitation Learning

Séquence progressive de démonstrations de difficulté croissante pour faciliter l'apprentissage.

14 शब्द
🔍

कोई परिणाम नहीं मिला