🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Batch

Méthode IRL qui apprend à partir d'un ensemble fixe de démonstrations d'experts sans interaction active avec l'environnement.

20 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Actif

Approche IRL où l'agent sélectionne activement les actions à exécuter pour mieux comprendre la fonction de récompense de l'expert.

16 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Bayésien

Framework IRL utilisant l'inférence bayésienne pour modéliser l'incertitude sur la fonction de récompense à partir des démonstrations.

17 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse à partir de Préférences

Méthode IRL qui infère les récompenses à partir des comparaisons de préférences entre trajectoires plutôt que des démonstrations complètes.

16 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Hiérarchique

Approche IRL qui décompose les tâches complexes en sous-tâches hiérarchiques pour apprendre des fonctions de récompense à plusieurs niveaux.

12 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Multi-agents

Extension de l'IRL aux environnements où plusieurs agents interagissent et doivent apprendre des récompenses collectives ou individuelles.

18 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Profond

Utilisation de réseaux de neurones profonds pour représenter et apprendre des fonctions de récompense complexes à partir de données de haute dimension.

12 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Adversarial

Framework IRL utilisant des techniques de jeux adversariaux où le générateur et le discriminateur s'affrontent pour apprendre la récompense.

15 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse avec Apprentissage par Renforcement

Méthode transformant le problème IRL en un problème RL standard où l'agent apprend à maximiser la vraisemblance des démonstrations.

15 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Semi-supervisé

Approche IRL combinant des démonstrations étiquetées avec des données non étiquetées pour améliorer l'apprentissage des récompenses.

15 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse pour la Robotique

Application spécialisée de l'IRL pour apprendre les comportements robotiques à partir de démonstrations humaines en manipulation et navigation.

9 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse avec Retour d'Utilisateur

Méthode IRL intégrant activement le retour qualitatif des utilisateurs pour raffiner itérativement la fonction de récompense.

15 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse Coopératif

Framework IRL où l'humain et l'IA collaborent activement pour définir et optimiser conjointement les objectifs de récompense.

19 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse pour la Planification

Utilisation de l'IRL pour extraire les objectifs implicites à partir des plans existants afin d'améliorer les futurs systèmes de planification.

14 المصطلحات
📂
الفئات الفرعية

Apprentissage par Renforcement Inverse par Maximisation de l'Entropie

Approche IRL privilégiant les solutions de récompense avec une entropie maximale pour éviter le surajustement aux démonstrations.

11 المصطلحات
🔍

لم يتم العثور على نتائج