Inverse Reinforcement Learning - مسرد الذكاء الاصطناعي

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Batch

Méthode IRL qui apprend à partir d'un ensemble fixe de démonstrations d'experts sans interaction active avec l'environnement.

20 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Actif

Approche IRL où l'agent sélectionne activement les actions à exécuter pour mieux comprendre la fonction de récompense de l'expert.

16 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Bayésien

Framework IRL utilisant l'inférence bayésienne pour modéliser l'incertitude sur la fonction de récompense à partir des démonstrations.

17 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse à partir de Préférences

Méthode IRL qui infère les récompenses à partir des comparaisons de préférences entre trajectoires plutôt que des démonstrations complètes.

16 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Hiérarchique

Approche IRL qui décompose les tâches complexes en sous-tâches hiérarchiques pour apprendre des fonctions de récompense à plusieurs niveaux.

12 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Multi-agents

Extension de l'IRL aux environnements où plusieurs agents interagissent et doivent apprendre des récompenses collectives ou individuelles.

18 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Profond

Utilisation de réseaux de neurones profonds pour représenter et apprendre des fonctions de récompense complexes à partir de données de haute dimension.

12 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Adversarial

Framework IRL utilisant des techniques de jeux adversariaux où le générateur et le discriminateur s'affrontent pour apprendre la récompense.

15 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse avec Apprentissage par Renforcement

Méthode transformant le problème IRL en un problème RL standard où l'agent apprend à maximiser la vraisemblance des démonstrations.

15 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Semi-supervisé

Approche IRL combinant des démonstrations étiquetées avec des données non étiquetées pour améliorer l'apprentissage des récompenses.

15 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse pour la Robotique

Application spécialisée de l'IRL pour apprendre les comportements robotiques à partir de démonstrations humaines en manipulation et navigation.

9 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse avec Retour d'Utilisateur

Méthode IRL intégrant activement le retour qualitatif des utilisateurs pour raffiner itérativement la fonction de récompense.

15 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse Coopératif

Framework IRL où l'humain et l'IA collaborent activement pour définir et optimiser conjointement les objectifs de récompense.

19 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse pour la Planification

Utilisation de l'IRL pour extraire les objectifs implicites à partir des plans existants afin d'améliorer les futurs systèmes de planification.

14 المصطلحات

📂

الفئات الفرعية

Apprentissage par Renforcement Inverse par Maximisation de l'Entropie

Approche IRL privilégiant les solutions de récompense avec une entropie maximale pour éviter le surajustement aux démonstrations.

11 المصطلحات

قاموس الذكاء الاصطناعي

Apprentissage par Renforcement Inverse Batch

Apprentissage par Renforcement Inverse Actif

Apprentissage par Renforcement Inverse Bayésien

Apprentissage par Renforcement Inverse à partir de Préférences

Apprentissage par Renforcement Inverse Hiérarchique

Apprentissage par Renforcement Inverse Multi-agents

Apprentissage par Renforcement Inverse Profond

Apprentissage par Renforcement Inverse Adversarial

Apprentissage par Renforcement Inverse avec Apprentissage par Renforcement

Apprentissage par Renforcement Inverse Semi-supervisé

Apprentissage par Renforcement Inverse pour la Robotique

Apprentissage par Renforcement Inverse avec Retour d'Utilisateur

Apprentissage par Renforcement Inverse Coopératif

Apprentissage par Renforcement Inverse pour la Planification

Apprentissage par Renforcement Inverse par Maximisation de l'Entropie

لم يتم العثور على نتائج