🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

团队博弈论

合作多智能体学习的理论框架,其中智能体组成团队以实现共同目标,具有共享奖励和隐性协调机制。

📖
个术语

信用分配

多智能体学习中的基本问题,涉及正确将奖励或归咎分配给每个智能体,以表彰他们对团队整体结果的各自贡献。

📖
个术语

多智能体模仿学习

智能体通过观察和模仿其他智能体(专家或同行)的行为来学习的方法,用于在探索成本高的复杂环境中加速学习。

📖
个术语

多智能体联邦学习

去中心化方法,智能体在自己的数据上训练本地模型,并定期共享参数更新以构建全局模型,而不共享原始数据。

📖
个术语

混合策略

多智能体学习中的策略,每个智能体可以根据环境状态和其他智能体的行动,以变化的概率采用混合行为(追击者、逃避者、合作者)。

📖
个术语

部分观测学习

每个智能体只能访问环境全局状态一部分的范式,需要推理和通信技术来重建足以进行决策的理解。

📖
个术语

多智能体图神经网络

深度学习架构,其中智能体被建模为动态图中的节点,能够学习捕获智能体之间关系和依赖性的表示。

📖
个术语

元博弈学习

智能体通过快速适应其他智能体的变化策略来学习如何学习的技术,就像在元博弈中,适应能力本身成为需要优化的技能。

📖
个术语

多智能体收敛稳定性

一种确保在持续交互中,智能体策略仍能收敛至稳定均衡的特性,是已部署多智能体系统可靠性的关键条件。

🔍

未找到结果