Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Multi-Agent Reinforcement Learning
Paradigme d'apprentissage où plusieurs agents apprennent simultanément à prendre des décisions dans un environnement partagé, en interagissant les uns avec les autres pour optimiser des objectifs collectifs ou individuels.
Multi-Agent Deep Deterministic Policy Gradient (MADDPG)
Algorithme CTDE étendant DDPG aux environnements multi-agents, utilisant des critiques centralisées et des acteurs décentralisés pour apprendre dans des espaces d'action continus.
Multi-Agent Partially Observable Markov Decision Process (MPOMDP)
Formalisation mathématique des environnements MARL où chaque agent possède des observations partielles et doit inférer l'état global pour prendre des décisions optimales.
Mean Field Games
Théorie étudiant les interactions d'un grand nombre d'agents rationnels en approximant l'effet de la foule par un champ moyen, applicable aux systèmes multi-agents à grande échelle.
Continuous Control
Domaine d'application du MARL où les agents doivent contrôler des systèmes physiques avec des actions continues, comme la robotique mobile ou la manipulation d'objets.
Stochastic Games
Extension des MDP aux environnements multi-agents où les transitions et les récompenses dépendent des actions conjointes de tous les agents, modélisant des scénarios coopératifs et compétitifs.
Nash Equilibrium in MARL
Concept de stabilité où aucun agent ne peut améliorer sa récompense en modifiant unilatéralement sa stratégie, utilisé comme critère de convergence dans les algorithmes MARL compétitifs.
Coordination Protocols
Mécanismes de communication ou de synchronisation permettant aux agents d'aligner leurs actions pour atteindre des objectifs collectifs dans les environnements MARL continus.