Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
Apprentissage par Renforcement Multi-Agents (MARL)
Paradigme d'apprentissage où plusieurs agents interagissent et apprennent simultanément dans un environnement partagé, souvent de manière concurrente ou coopérative pour maximiser une récompense collective ou individuelle.
Jeux à Somme Non Nulle
Contexte d'interaction où les gains totaux des agents ne sont pas fixes, permettant des situations de coopération où les agents peuvent mutuellement bénéficier de leurs actions pour améliorer la récompense globale.
Q-Learning Décentralisé
Variante du Q-Learning où chaque agent apprend sa propre fonction de valeur Q de manière indépendante, sans partage direct d'informations sur les politiques ou les valeurs des autres agents.
Q-Learning Centralisé avec Exécution Décentralisée (CTDE)
Cadre d'apprentissage où les agents utilisent des informations globales (centralisées) durant la phase d'entraînement pour évaluer les actions, mais prennent leurs décisions de manière décentralisée lors de l'exécution.
Théorie des Jeux Stochastiques
Extension de la théorie des jeux aux environnements où les transitions d'états et les récompenses sont probabilistes, fournissant un modèle mathématique formel pour les interactions multi-agents dans des contextes dynamiques.
Dilemme du Prisonnier Itératif
Version répétée du dilemme du prisonnier, utilisée en MARL pour étudier l'émergence de stratégies coopératives ou compétitives basées sur l'historique des interactions entre agents.
Réseaux d'Agents Adversariaux (GANs Multi-Agents)
Application des réseaux génératifs adversariaux où plusieurs agents (générateurs et discriminateurs) sont en compétition, chacun apprenant à améliorer sa performance en réponse aux stratégies des autres.
Apprentissage par Renforcement Hiérarchique Multi-Agents
Approche structurant l'apprentissage sur plusieurs niveaux, où des agents de haut niveau définissent des sous-tâches pour des agents de bas niveau, facilitant la résolution de problèmes complexes et la coordination.
Stabilité Environnementale
Problème en MARL où l'environnement perçu par un agent change constamment car les autres agents apprennent et adaptent leurs politiques, rendant l'apprentissage d'une politique optimale particulièrement difficile.
Exploration vs Exploitation en Multi-Agents
Dilemme complexifié par la présence d'autres agents, où l'exploration d'un agent peut être perçue comme du bruit ou une action hostile par les autres, et où l'exploitation peut dépendre des stratégies concurrentes.
Apprentissage par Renforcement Inverse Multi-Agents
Technique où les agents infèrent la fonction de récompense ou les intentions des autres agents en observant leur comportement, afin de mieux prédire leurs actions et de coopérer ou de compétitionner plus efficacement.
Politiques Mixtes
Stratégie où un agent choisit ses actions selon une distribution de probabilité, plutôt que de manière déterministe, essentielle pour atteindre un équilibre de Nash dans les jeux à somme nulle.
Formation de Coalitions
Processus dynamique par lequel des sous-groupes d'agents s'allient pour poursuivre un objectif commun, partageant des récompenses et des informations pour améliorer leur performance par rapport à une action individuelle.
Apprentissage Continu Multi-Agents
Défi consistant à permettre aux agents d'adapter leurs politiques à de nouvelles tâches ou à l'arrivée/départ d'autres agents sans oublier les connaissances précédemment acquises, assurant la robustesse et la flexibilité du système.
Méta-Apprentissage en MARL
Approche visant à entraîner des agents à apprendre comment apprendre efficacement dans une variété de tâches multi-agents, leur permettant de s'adapter rapidement à de nouveaux environnements ou à de nouvelles configurations d'agents.