AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
团队博弈论
合作多智能体学习的理论框架,其中智能体组成团队以实现共同目标,具有共享奖励和隐性协调机制。
術語
信用分配
多智能体学习中的基本问题,涉及正确将奖励或归咎分配给每个智能体,以表彰他们对团队整体结果的各自贡献。
術語
多智能体模仿学习
智能体通过观察和模仿其他智能体(专家或同行)的行为来学习的方法,用于在探索成本高的复杂环境中加速学习。
術語
多智能体联邦学习
去中心化方法,智能体在自己的数据上训练本地模型,并定期共享参数更新以构建全局模型,而不共享原始数据。
術語
混合策略
多智能体学习中的策略,每个智能体可以根据环境状态和其他智能体的行动,以变化的概率采用混合行为(追击者、逃避者、合作者)。
術語
部分观测学习
每个智能体只能访问环境全局状态一部分的范式,需要推理和通信技术来重建足以进行决策的理解。
術語
多智能体图神经网络
深度学习架构,其中智能体被建模为动态图中的节点,能够学习捕获智能体之间关系和依赖性的表示。
術語
元博弈学习
智能体通过快速适应其他智能体的变化策略来学习如何学习的技术,就像在元博弈中,适应能力本身成为需要优化的技能。
術語
多智能体收敛稳定性
一种确保在持续交互中,智能体策略仍能收敛至稳定均衡的特性,是已部署多智能体系统可靠性的关键条件。
🔍