多智能体学习 - AI 詞彙表

📖

術語

合作多智能体学习的理论框架，其中智能体组成团队以实现共同目标，具有共享奖励和隐性协调机制。

📖

術語

多智能体学习中的基本问题，涉及正确将奖励或归咎分配给每个智能体，以表彰他们对团队整体结果的各自贡献。

📖

術語

智能体通过观察和模仿其他智能体（专家或同行）的行为来学习的方法，用于在探索成本高的复杂环境中加速学习。

📖

術語

去中心化方法，智能体在自己的数据上训练本地模型，并定期共享参数更新以构建全局模型，而不共享原始数据。

📖

術語

多智能体学习中的策略，每个智能体可以根据环境状态和其他智能体的行动，以变化的概率采用混合行为（追击者、逃避者、合作者）。

📖

術語

每个智能体只能访问环境全局状态一部分的范式，需要推理和通信技术来重建足以进行决策的理解。

📖

術語

深度学习架构，其中智能体被建模为动态图中的节点，能够学习捕获智能体之间关系和依赖性的表示。

📖

術語

智能体通过快速适应其他智能体的变化策略来学习如何学习的技术，就像在元博弈中，适应能力本身成为需要优化的技能。

📖

術語

一种确保在持续交互中，智能体策略仍能收敛至稳定均衡的特性，是已部署多智能体系统可靠性的关键条件。

AI 詞彙表