AI 용어집
인공지능 완전 사전
Agents autonomes
Entités logicielles capables de prendre des décisions indépendantes basées sur leur perception de l'environnement et leurs objectifs propres, sans intervention humaine directe.
Coopération entre agents
Stratégie où plusieurs agents collaborent pour atteindre un objectif commun, partageant informations et coordonnant leurs actions pour maximiser une récompense collective.
Compétition entre agents
Situation où les agents poursuivent des objectifs conflictuels, chacun cherchant à maximiser sa propre récompense au détriment des autres agents dans l'environnement.
Apprentissage décentralisé
Approche où chaque agent apprend sa propre politique de manière indépendante sans accès à l'état global ou aux actions des autres agents, utilisant uniquement ses observations locales.
Apprentissage centralisé
Méthode où un contrôleur central a accès à toutes les informations de l'environnement et coordonne les actions de tous les agents pour optimiser un objectif global.
Communication inter-agents
Mécanisme permettant aux agents d'échanger des informations directement pour améliorer leur coordination et leur performance collective dans des tâches complexes.
Jeux à somme nulle
Scénario compétitif où le gain total est constant, impliquant que le gain d'un agent correspond exactement à la perte des autres agents dans le système.
Jeux à somme non nulle
Situations où les agents peuvent collaborer pour augmenter le gain total, permettant des résultats mutuellement bénéfiques et des stratégies coopératives.
Théorie des jeux
Cadre mathématique formel pour modéliser et analyser les interactions stratégiques entre agents rationnels prenant des décisions interdépendantes.
Politiques partagées
Approche où plusieurs agents partagent une politique commune ou des paramètres de réseau neuronal, permettant un apprentissage plus efficace et une généralisation accrue.
Reward shaping multi-agents
Technique de modification des fonctions de récompense pour guider l'apprentissage des agents vers des comportements désirés tout en préservant l'optimalité de la politique.
Exploration vs exploitation multi-agents
Dilemme complexifié en contexte multi-agents où chaque agent doit équilibrer découverte de nouvelles stratégies et utilisation des connaissances acquises en considérant l'impact sur les autres.
Emergence de comportements collectifs
Phénomène où des comportements complexes et organisés apparaissent spontanément de l'interaction d'agents simples suivant des règles locales, sans contrôle central explicite.
Systèmes multi-agents distribués
Architecture où les agents sont répartis sur différents nœuds computationnels, communiquant via des protocoles réseau pour accomplir des tâches collaboratives à grande échelle.
Apprentissage par renforcement hiérarchique
Approche structurant l'apprentissage en niveaux hiérarchiques, avec des méta-agents contrôlant des sous-agents pour résoudre des problèmes complexes par décomposition.
Markov games
Formalisation mathématique des jeux stochastiques où les agents prennent des décisions simultanément à chaque étape, avec des transitions d'états markoviennes et des récompenses individuelles.