BenchVibe AI Ecosystem

VIP 👤

🏠 首页

基准测试

📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试

模型

🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式

资源

💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200

个类别

2,608

个子类别

30,011

个术语

多智能体强化学习

多个智能体在共享环境中同时学习决策的范式，通过相互交互来优化集体或个体目标。

多智能体深度确定性策略梯度（MADDPG）

将DDPG扩展到多智能体环境的CTDE算法，使用集中式评论家和分散式执行器在连续动作空间中学习。

多智能体部分可观测马尔可夫决策过程（MPOMDP）

MARL环境的数学形式化，其中每个智能体具有部分观测，必须推断全局状态以做出最优决策。

平均场博弈

研究大量理性智能体相互作用的理论，通过平均场近似群体效应，适用于大规模多智能体系统。

连续控制

MARL的应用领域，智能体需要控制具有连续动作的物理系统，如移动机器人或物体操控。

随机博弈

将MDP扩展到多智能体环境，其中状态转移和奖励取决于所有智能体的联合动作，模拟合作和竞争场景。

MARL中的纳什均衡

稳定性概念，任何智能体都无法通过单方面改变策略来提高其奖励，用作竞争性MARL算法的收敛标准。

协调协议

通信或同步机制，使智能体能够在连续MARL环境中协调行动以实现集体目标。

🔍

未找到结果