Apprentissage par Renforcement Multi-Agents

📖

termini

Apprentissage par Renforcement Multi-Agents (MARL)

Paradigme d'apprentissage où plusieurs agents interagissent et apprennent simultanément dans un environnement partagé, souvent de manière concurrente ou coopérative pour maximiser une récompense collective ou individuelle.

📖

termini

Jeux à Somme Non Nulle

Contexte d'interaction où les gains totaux des agents ne sont pas fixes, permettant des situations de coopération où les agents peuvent mutuellement bénéficier de leurs actions pour améliorer la récompense globale.

📖

termini

Q-Learning Décentralisé

Variante du Q-Learning où chaque agent apprend sa propre fonction de valeur Q de manière indépendante, sans partage direct d'informations sur les politiques ou les valeurs des autres agents.

📖

termini

Q-Learning Centralisé avec Exécution Décentralisée (CTDE)

Cadre d'apprentissage où les agents utilisent des informations globales (centralisées) durant la phase d'entraînement pour évaluer les actions, mais prennent leurs décisions de manière décentralisée lors de l'exécution.

📖

termini

Théorie des Jeux Stochastiques

Extension de la théorie des jeux aux environnements où les transitions d'états et les récompenses sont probabilistes, fournissant un modèle mathématique formel pour les interactions multi-agents dans des contextes dynamiques.

📖

termini

Dilemme du Prisonnier Itératif

Version répétée du dilemme du prisonnier, utilisée en MARL pour étudier l'émergence de stratégies coopératives ou compétitives basées sur l'historique des interactions entre agents.

📖

termini

Réseaux d'Agents Adversariaux (GANs Multi-Agents)

Application des réseaux génératifs adversariaux où plusieurs agents (générateurs et discriminateurs) sont en compétition, chacun apprenant à améliorer sa performance en réponse aux stratégies des autres.

📖

termini

Apprentissage par Renforcement Hiérarchique Multi-Agents

Approche structurant l'apprentissage sur plusieurs niveaux, où des agents de haut niveau définissent des sous-tâches pour des agents de bas niveau, facilitant la résolution de problèmes complexes et la coordination.

📖

termini

Stabilité Environnementale

Problème en MARL où l'environnement perçu par un agent change constamment car les autres agents apprennent et adaptent leurs politiques, rendant l'apprentissage d'une politique optimale particulièrement difficile.

📖

termini

Exploration vs Exploitation en Multi-Agents

Dilemme complexifié par la présence d'autres agents, où l'exploration d'un agent peut être perçue comme du bruit ou une action hostile par les autres, et où l'exploitation peut dépendre des stratégies concurrentes.

📖

termini

Apprentissage par Renforcement Inverse Multi-Agents

Technique où les agents infèrent la fonction de récompense ou les intentions des autres agents en observant leur comportement, afin de mieux prédire leurs actions et de coopérer ou de compétitionner plus efficacement.

📖

termini

Politiques Mixtes

Stratégie où un agent choisit ses actions selon une distribution de probabilité, plutôt que de manière déterministe, essentielle pour atteindre un équilibre de Nash dans les jeux à somme nulle.

📖

termini

Formation de Coalitions

Processus dynamique par lequel des sous-groupes d'agents s'allient pour poursuivre un objectif commun, partageant des récompenses et des informations pour améliorer leur performance par rapport à une action individuelle.

📖

termini

Apprentissage Continu Multi-Agents

Défi consistant à permettre aux agents d'adapter leurs politiques à de nouvelles tâches ou à l'arrivée/départ d'autres agents sans oublier les connaissances précédemment acquises, assurant la robustesse et la flexibilité du système.

📖

termini

Méta-Apprentissage en MARL

Approche visant à entraîner des agents à apprendre comment apprendre efficacement dans une variété de tâches multi-agents, leur permettant de s'adapter rapidement à de nouveaux environnements ou à de nouvelles configurations d'agents.

Glossario IA