🏠 Accueil
基準測試
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles

AI 詞彙表

人工智能完整詞典

200
類別
2,608
子類別
30,011
術語
📖
術語

零和博弈

理论场景中,一个智能体的总收益恰好等于另一个智能体的损失,在多智能体对抗学习中用于建模严格竞争关系的基础概念。

📖
術語

极小化极大算法

决策算法,在对抗性情境中最大化可能的最小收益,用于制定针对对手最坏行动的稳健策略。

📖
術語

纳什均衡

稳定状态,其中任何智能体都无法通过单方面改变其行为来改善自身策略,对于分析对抗性多智能体强化学习中的均衡点至关重要。

📖
術語

自我对弈

训练方法,智能体通过与具有进化策略的自身副本竞争来学习,无需外部数据。

📖
術語

稳健策略

强化学习策略,在面对对抗性扰动或环境意外变化时仍能保持高性能表现。

📖
術語

最坏情况优化

优化范式,旨在最不利场景中最大化性能,对于开发能够抵御对抗性攻击的弹性智能体至关重要。

📖
術語

对抗性攻击

智能体通过操纵环境或注入恶意扰动,故意降低其他智能体性能的行为。

📖
術語

防御策略

为在多智能体系统中检测、对抗和从对抗性攻击中恢复而设计的一系列机制和策略。

📖
術語

对抗性环境

一种学习环境,旨在主动向智能体呈现挑战和障碍,模拟现实世界中敌对或不可预测的条件。

📖
術語

策略蒸馏

一种知识转移技术,将智能体学习的复杂策略压缩为更简单有效的形式,通常在对抗性训练后使用。

📖
術語

对抗性强化学习

一种强化学习范式,在训练过程中明确整合对抗性智能体,以提高鲁棒性和泛化能力。

📖
術語

多智能体对抗赌博机

赌博机问题的扩展,其中多个智能体在环境中交互,奖励可能被对手操纵。

📖
術語

对抗性模仿学习

使用对抗性判别器来评估和改进模仿专家行为质量的模仿学习方法。

📖
術語

鲁棒性测试

系统评估智能体在极端场景和协同攻击下的性能,以衡量其韧性并识别漏洞。

📖
術語

对抗性扰动

对观察或环境进行的细微但有意的修改,旨在诱导目标智能体在决策中出错。

📖
術語

策略不确定性

关于对手未来意图和策略的不确定性,需要在多智能体决策中采用概率性和自适应方法。

📖
術語

博弈论多智能体强化学习

将博弈论应用于多智能体强化学习,用于分析和优化竞争性情境中的策略行为。

🔍

搵唔到結果