Apprentissage Multi-agents - 인공지능 용어집

📖

용어

Agents autonomes

Entités logicielles capables de prendre des décisions indépendantes basées sur leur perception de l'environnement et leurs objectifs propres, sans intervention humaine directe.

📖

용어

Coopération entre agents

Stratégie où plusieurs agents collaborent pour atteindre un objectif commun, partageant informations et coordonnant leurs actions pour maximiser une récompense collective.

📖

용어

Compétition entre agents

Situation où les agents poursuivent des objectifs conflictuels, chacun cherchant à maximiser sa propre récompense au détriment des autres agents dans l'environnement.

📖

용어

Apprentissage décentralisé

Approche où chaque agent apprend sa propre politique de manière indépendante sans accès à l'état global ou aux actions des autres agents, utilisant uniquement ses observations locales.

📖

용어

Apprentissage centralisé

Méthode où un contrôleur central a accès à toutes les informations de l'environnement et coordonne les actions de tous les agents pour optimiser un objectif global.

📖

용어

Communication inter-agents

Mécanisme permettant aux agents d'échanger des informations directement pour améliorer leur coordination et leur performance collective dans des tâches complexes.

📖

용어

Jeux à somme nulle

Scénario compétitif où le gain total est constant, impliquant que le gain d'un agent correspond exactement à la perte des autres agents dans le système.

📖

용어

Jeux à somme non nulle

Situations où les agents peuvent collaborer pour augmenter le gain total, permettant des résultats mutuellement bénéfiques et des stratégies coopératives.

📖

용어

Théorie des jeux

Cadre mathématique formel pour modéliser et analyser les interactions stratégiques entre agents rationnels prenant des décisions interdépendantes.

📖

용어

Politiques partagées

Approche où plusieurs agents partagent une politique commune ou des paramètres de réseau neuronal, permettant un apprentissage plus efficace et une généralisation accrue.

📖

용어

Reward shaping multi-agents

Technique de modification des fonctions de récompense pour guider l'apprentissage des agents vers des comportements désirés tout en préservant l'optimalité de la politique.

📖

용어

Exploration vs exploitation multi-agents

Dilemme complexifié en contexte multi-agents où chaque agent doit équilibrer découverte de nouvelles stratégies et utilisation des connaissances acquises en considérant l'impact sur les autres.

📖

용어

Emergence de comportements collectifs

Phénomène où des comportements complexes et organisés apparaissent spontanément de l'interaction d'agents simples suivant des règles locales, sans contrôle central explicite.

📖

용어

Systèmes multi-agents distribués

Architecture où les agents sont répartis sur différents nœuds computationnels, communiquant via des protocoles réseau pour accomplir des tâches collaboratives à grande échelle.

📖

용어

Apprentissage par renforcement hiérarchique

Approche structurant l'apprentissage en niveaux hiérarchiques, avec des méta-agents contrôlant des sous-agents pour résoudre des problèmes complexes par décomposition.

📖

용어

Markov games

Formalisation mathématique des jeux stochastiques où les agents prennent des décisions simultanément à chaque étape, avec des transitions d'états markoviennes et des récompenses individuelles.

AI 용어집