🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles

Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242
catégories
3 353
sous-catégories
40 780
termes
📖
termes

Multi-Agent Reinforcement Learning

Paradigme d'apprentissage où plusieurs agents apprennent simultanément à prendre des décisions dans un environnement partagé, en interagissant les uns avec les autres pour optimiser des objectifs collectifs ou individuels.

📖
termes

Multi-Agent Deep Deterministic Policy Gradient (MADDPG)

Algorithme CTDE étendant DDPG aux environnements multi-agents, utilisant des critiques centralisées et des acteurs décentralisés pour apprendre dans des espaces d'action continus.

📖
termes

Multi-Agent Partially Observable Markov Decision Process (MPOMDP)

Formalisation mathématique des environnements MARL où chaque agent possède des observations partielles et doit inférer l'état global pour prendre des décisions optimales.

📖
termes

Mean Field Games

Théorie étudiant les interactions d'un grand nombre d'agents rationnels en approximant l'effet de la foule par un champ moyen, applicable aux systèmes multi-agents à grande échelle.

📖
termes

Continuous Control

Domaine d'application du MARL où les agents doivent contrôler des systèmes physiques avec des actions continues, comme la robotique mobile ou la manipulation d'objets.

📖
termes

Stochastic Games

Extension des MDP aux environnements multi-agents où les transitions et les récompenses dépendent des actions conjointes de tous les agents, modélisant des scénarios coopératifs et compétitifs.

📖
termes

Nash Equilibrium in MARL

Concept de stabilité où aucun agent ne peut améliorer sa récompense en modifiant unilatéralement sa stratégie, utilisé comme critère de convergence dans les algorithmes MARL compétitifs.

📖
termes

Coordination Protocols

Mécanismes de communication ou de synchronisation permettant aux agents d'aligner leurs actions pour atteindre des objectifs collectifs dans les environnements MARL continus.

🔍

Aucun résultat trouvé