Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242

catégories

3 353

sous-catégories

40 780

termes

📖

termes

Multi-Agent Reinforcement Learning

Paradigme d'apprentissage où plusieurs agents apprennent simultanément à prendre des décisions dans un environnement partagé, en interagissant les uns avec les autres pour optimiser des objectifs collectifs ou individuels.

📖

termes

Multi-Agent Deep Deterministic Policy Gradient (MADDPG)

Algorithme CTDE étendant DDPG aux environnements multi-agents, utilisant des critiques centralisées et des acteurs décentralisés pour apprendre dans des espaces d'action continus.

📖

termes

Multi-Agent Partially Observable Markov Decision Process (MPOMDP)

Formalisation mathématique des environnements MARL où chaque agent possède des observations partielles et doit inférer l'état global pour prendre des décisions optimales.

📖

termes

Mean Field Games

Théorie étudiant les interactions d'un grand nombre d'agents rationnels en approximant l'effet de la foule par un champ moyen, applicable aux systèmes multi-agents à grande échelle.

📖

termes

Continuous Control

Domaine d'application du MARL où les agents doivent contrôler des systèmes physiques avec des actions continues, comme la robotique mobile ou la manipulation d'objets.

📖

termes

Stochastic Games

Extension des MDP aux environnements multi-agents où les transitions et les récompenses dépendent des actions conjointes de tous les agents, modélisant des scénarios coopératifs et compétitifs.

📖

termes

Nash Equilibrium in MARL

Concept de stabilité où aucun agent ne peut améliorer sa récompense en modifiant unilatéralement sa stratégie, utilisé comme critère de convergence dans les algorithmes MARL compétitifs.

📖

termes

Coordination Protocols

Mécanismes de communication ou de synchronisation permettant aux agents d'aligner leurs actions pour atteindre des objectifs collectifs dans les environnements MARL continus.

🔍

Glossaire IA

Multi-Agent Reinforcement Learning

Multi-Agent Deep Deterministic Policy Gradient (MADDPG)

Multi-Agent Partially Observable Markov Decision Process (MPOMDP)

Mean Field Games

Continuous Control

Stochastic Games

Nash Equilibrium in MARL

Coordination Protocols

Aucun résultat trouvé