Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Théorie des Jeux d'Équipe
Cadre théorique pour l'apprentissage multi-agents coopératifs où les agents forment une équipe pour atteindre un objectif commun, avec des mécanismes de récompense partagée et de coordination implicite.
Découpe de Crédit (Credit Assignment)
Problème fondamental en apprentissage multi-agents consistant à attribuer correctement la récompense ou le blâme à chaque agent pour leurs contributions respectives au résultat global de l'équipe.
Apprentissage par Imitation Multi-Agents
Méthode où les agents apprennent en observant et imitant le comportement d'autres agents (experts ou pairs), utilisée pour accélérer l'apprentissage dans des environnements complexes avec exploration coûteuse.
Apprentissage Fédéré Multi-Agents
Approche décentralisée où les agents entraînent des modèles locaux sur leurs propres données et partagent périodiquement des mises à jour de paramètres pour construire un modèle global sans partager de données brutes.
Politiques Mixtes (Mixed Policies)
Stratégies en apprentissage multi-agents où chaque agent peut adopter un mélange de comportements (pursuer, éviteur, coopérateur) avec des probabilités changeantes selon l'état de l'environnement et les actions des autres agents.
Apprentissage avec Observation Partielle
Paradigme où chaque agent n'a accès qu'à une partie de l'état global de l'environnement, nécessitant des techniques d'inférence et de communication pour reconstruire une compréhension suffisante pour la prise de décision.
Réseaux de Neurones Graphiques Multi-Agents
Architecture de deep learning où les agents sont modélisés comme des nœuds dans un graphe dynamique, permettant d'apprendre des représentations qui capturent les relations et les dépendances entre les agents.
Apprentissage par Méta-jeu
Technique où les agents apprennent à apprendre en s'adaptant rapidement aux stratégies changeantes des autres agents, comme dans un méta-jeu où la capacité d'adaptation devient elle-même une compétence à optimiser.
Stabilité Convergente en Apprentissage Multi-Agents
Propriété garantissant que les politiques des agents convergent vers un équilibre stable malgré les interactions continues, condition essentielle pour la fiabilité des systèmes multi-agents déployés.