🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

零和博弈

理论场景中,一个智能体的总收益恰好等于另一个智能体的损失,在多智能体对抗学习中用于建模严格竞争关系的基础概念。

📖
个术语

极小化极大算法

决策算法,在对抗性情境中最大化可能的最小收益,用于制定针对对手最坏行动的稳健策略。

📖
个术语

纳什均衡

稳定状态,其中任何智能体都无法通过单方面改变其行为来改善自身策略,对于分析对抗性多智能体强化学习中的均衡点至关重要。

📖
个术语

自我对弈

训练方法,智能体通过与具有进化策略的自身副本竞争来学习,无需外部数据。

📖
个术语

稳健策略

强化学习策略,在面对对抗性扰动或环境意外变化时仍能保持高性能表现。

📖
个术语

最坏情况优化

优化范式,旨在最不利场景中最大化性能,对于开发能够抵御对抗性攻击的弹性智能体至关重要。

📖
个术语

对抗性攻击

智能体通过操纵环境或注入恶意扰动,故意降低其他智能体性能的行为。

📖
个术语

防御策略

为在多智能体系统中检测、对抗和从对抗性攻击中恢复而设计的一系列机制和策略。

📖
个术语

对抗性环境

一种学习环境,旨在主动向智能体呈现挑战和障碍,模拟现实世界中敌对或不可预测的条件。

📖
个术语

策略蒸馏

一种知识转移技术,将智能体学习的复杂策略压缩为更简单有效的形式,通常在对抗性训练后使用。

📖
个术语

对抗性强化学习

一种强化学习范式,在训练过程中明确整合对抗性智能体,以提高鲁棒性和泛化能力。

📖
个术语

多智能体对抗赌博机

赌博机问题的扩展,其中多个智能体在环境中交互,奖励可能被对手操纵。

📖
个术语

对抗性模仿学习

使用对抗性判别器来评估和改进模仿专家行为质量的模仿学习方法。

📖
个术语

鲁棒性测试

系统评估智能体在极端场景和协同攻击下的性能,以衡量其韧性并识别漏洞。

📖
个术语

对抗性扰动

对观察或环境进行的细微但有意的修改,旨在诱导目标智能体在决策中出错。

📖
个术语

策略不确定性

关于对手未来意图和策略的不确定性,需要在多智能体决策中采用概率性和自适应方法。

📖
个术语

博弈论多智能体强化学习

将博弈论应用于多智能体强化学习,用于分析和优化竞争性情境中的策略行为。

🔍

未找到结果