🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📂
subcategorías

Apprentissage par Renforcement Inverse Batch

Méthode IRL qui apprend à partir d'un ensemble fixe de démonstrations d'experts sans interaction active avec l'environnement.

20 términos
📂
subcategorías

Apprentissage par Renforcement Inverse Actif

Approche IRL où l'agent sélectionne activement les actions à exécuter pour mieux comprendre la fonction de récompense de l'expert.

16 términos
📂
subcategorías

Apprentissage par Renforcement Inverse Bayésien

Framework IRL utilisant l'inférence bayésienne pour modéliser l'incertitude sur la fonction de récompense à partir des démonstrations.

17 términos
📂
subcategorías

Apprentissage par Renforcement Inverse à partir de Préférences

Méthode IRL qui infère les récompenses à partir des comparaisons de préférences entre trajectoires plutôt que des démonstrations complètes.

16 términos
📂
subcategorías

Apprentissage par Renforcement Inverse Hiérarchique

Approche IRL qui décompose les tâches complexes en sous-tâches hiérarchiques pour apprendre des fonctions de récompense à plusieurs niveaux.

12 términos
📂
subcategorías

Apprentissage par Renforcement Inverse Multi-agents

Extension de l'IRL aux environnements où plusieurs agents interagissent et doivent apprendre des récompenses collectives ou individuelles.

18 términos
📂
subcategorías

Apprentissage par Renforcement Inverse Profond

Utilisation de réseaux de neurones profonds pour représenter et apprendre des fonctions de récompense complexes à partir de données de haute dimension.

12 términos
📂
subcategorías

Apprentissage par Renforcement Inverse Adversarial

Framework IRL utilisant des techniques de jeux adversariaux où le générateur et le discriminateur s'affrontent pour apprendre la récompense.

15 términos
📂
subcategorías

Apprentissage par Renforcement Inverse avec Apprentissage par Renforcement

Méthode transformant le problème IRL en un problème RL standard où l'agent apprend à maximiser la vraisemblance des démonstrations.

15 términos
📂
subcategorías

Apprentissage par Renforcement Inverse Semi-supervisé

Approche IRL combinant des démonstrations étiquetées avec des données non étiquetées pour améliorer l'apprentissage des récompenses.

15 términos
📂
subcategorías

Apprentissage par Renforcement Inverse pour la Robotique

Application spécialisée de l'IRL pour apprendre les comportements robotiques à partir de démonstrations humaines en manipulation et navigation.

9 términos
📂
subcategorías

Apprentissage par Renforcement Inverse avec Retour d'Utilisateur

Méthode IRL intégrant activement le retour qualitatif des utilisateurs pour raffiner itérativement la fonction de récompense.

15 términos
📂
subcategorías

Apprentissage par Renforcement Inverse Coopératif

Framework IRL où l'humain et l'IA collaborent activement pour définir et optimiser conjointement les objectifs de récompense.

19 términos
📂
subcategorías

Apprentissage par Renforcement Inverse pour la Planification

Utilisation de l'IRL pour extraire les objectifs implicites à partir des plans existants afin d'améliorer les futurs systèmes de planification.

14 términos
📂
subcategorías

Apprentissage par Renforcement Inverse par Maximisation de l'Entropie

Approche IRL privilégiant les solutions de récompense avec une entropie maximale pour éviter le surajustement aux démonstrations.

11 términos
🔍

No se encontraron resultados