Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Zero-Sum Game
Scénario théorique où le gain total d'un agent correspond exactement à la perte d'un autre, fondamental dans l'apprentissage adversarial multi-agents pour modéliser des compétitions strictes.
Minimax Algorithm
Algorithme décisionnel qui maximise le gain minimum possible dans des situations adversariales, utilisé pour développer des stratégies robustes contre les pires actions de l'adversaire.
Nash Equilibrium
État stable où aucun agent ne peut améliorer sa stratégie en modifiant unilatéralement son comportement, crucial pour analyser les points d'équilibre dans les MARL adversariaux.
Self-Play
Méthodologie d'entraînement où un agent apprend en compétant contre des copies de lui-même avec des stratégies évolutives, éliminant le besoin de données externes.
Robust Policy
Politique d'apprentissage par renforcement maintenissant des performances élevées face à des perturbations adversariales ou des changements inattendus dans l'environnement.
Worst-Case Optimization
Paradigme d'optimisation visant à maximiser les performances dans les scénarios les plus défavorables, essentiel pour développer des agents résilients aux attaques adversariales.
Adversarial Attack
Action délibérée d'un agent visant à dégrader les performances d'un autre agent par manipulation de l'environnement ou injection de perturbations malveillantes.
Defense Strategy
Ensemble de mécanismes et politiques conçus pour détecter, contrer et récupérer des attaques adversariales dans les systèmes multi-agents.
Adversarial Environment
Environnement d'apprentissage conçu pour présenter activement des défis et obstacles aux agents, simulant des conditions réelles hostiles ou imprévisibles.
Policy Distillation
Technique de transfert de connaissances où une politique complexe apprise par un agent est compressée en une forme plus simple et efficace, souvent utilisée après l'entraînement adversarial.
Adversarial Reinforcement Learning
Paradigme d'apprentissage par renforcement intégrant explicitement des agents adversaires dans le processus d'entraînement pour améliorer la robustesse et les capacités de généralisation.
Multi-Agent Adversarial Bandit
Extension du problème des bandits manchots où plusieurs agents interagissent dans un environnement avec des récompenses potentiellement manipulées par des adversaires.
Adversarial Imitation Learning
Approche d'apprentissage par imitation utilisant des discriminateurs adversariaux pour évaluer et améliorer la qualité du comportement imité par rapport aux experts.
Robustness Testing
Évaluation systématique des performances des agents face à des scénarios extrêmes et des attaques coordonnées pour mesurer leur résilience et identifier les vulnérabilités.
Adversarial Perturbation
Modification subtile mais intentionnelle des observations ou de l'environnement conçue pour induire des erreurs dans la prise de décision d'un agent cible.
Strategic Uncertainty
Incertitude quant aux intentions et stratégies futures des adversaires, nécessitant des approches probabilistes et adaptatives dans la prise de décision multi-agents.
Game-Theoretic MARL
Application de la théorie des jeux à l'apprentissage par renforcement multi-agents pour analyser et optimiser les comportements stratégiques dans des contextes compétitifs.