🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles

Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242
catégories
3 353
sous-catégories
40 780
termes
📖
termes

Zero-Sum Game

Scénario théorique où le gain total d'un agent correspond exactement à la perte d'un autre, fondamental dans l'apprentissage adversarial multi-agents pour modéliser des compétitions strictes.

📖
termes

Minimax Algorithm

Algorithme décisionnel qui maximise le gain minimum possible dans des situations adversariales, utilisé pour développer des stratégies robustes contre les pires actions de l'adversaire.

📖
termes

Nash Equilibrium

État stable où aucun agent ne peut améliorer sa stratégie en modifiant unilatéralement son comportement, crucial pour analyser les points d'équilibre dans les MARL adversariaux.

📖
termes

Self-Play

Méthodologie d'entraînement où un agent apprend en compétant contre des copies de lui-même avec des stratégies évolutives, éliminant le besoin de données externes.

📖
termes

Robust Policy

Politique d'apprentissage par renforcement maintenissant des performances élevées face à des perturbations adversariales ou des changements inattendus dans l'environnement.

📖
termes

Worst-Case Optimization

Paradigme d'optimisation visant à maximiser les performances dans les scénarios les plus défavorables, essentiel pour développer des agents résilients aux attaques adversariales.

📖
termes

Adversarial Attack

Action délibérée d'un agent visant à dégrader les performances d'un autre agent par manipulation de l'environnement ou injection de perturbations malveillantes.

📖
termes

Defense Strategy

Ensemble de mécanismes et politiques conçus pour détecter, contrer et récupérer des attaques adversariales dans les systèmes multi-agents.

📖
termes

Adversarial Environment

Environnement d'apprentissage conçu pour présenter activement des défis et obstacles aux agents, simulant des conditions réelles hostiles ou imprévisibles.

📖
termes

Policy Distillation

Technique de transfert de connaissances où une politique complexe apprise par un agent est compressée en une forme plus simple et efficace, souvent utilisée après l'entraînement adversarial.

📖
termes

Adversarial Reinforcement Learning

Paradigme d'apprentissage par renforcement intégrant explicitement des agents adversaires dans le processus d'entraînement pour améliorer la robustesse et les capacités de généralisation.

📖
termes

Multi-Agent Adversarial Bandit

Extension du problème des bandits manchots où plusieurs agents interagissent dans un environnement avec des récompenses potentiellement manipulées par des adversaires.

📖
termes

Adversarial Imitation Learning

Approche d'apprentissage par imitation utilisant des discriminateurs adversariaux pour évaluer et améliorer la qualité du comportement imité par rapport aux experts.

📖
termes

Robustness Testing

Évaluation systématique des performances des agents face à des scénarios extrêmes et des attaques coordonnées pour mesurer leur résilience et identifier les vulnérabilités.

📖
termes

Adversarial Perturbation

Modification subtile mais intentionnelle des observations ou de l'environnement conçue pour induire des erreurs dans la prise de décision d'un agent cible.

📖
termes

Strategic Uncertainty

Incertitude quant aux intentions et stratégies futures des adversaires, nécessitant des approches probabilistes et adaptatives dans la prise de décision multi-agents.

📖
termes

Game-Theoretic MARL

Application de la théorie des jeux à l'apprentissage par renforcement multi-agents pour analyser et optimiser les comportements stratégiques dans des contextes compétitifs.

🔍

Aucun résultat trouvé