AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
子類別
批量逆向强化学习
一种从固定的专家演示集合中学习而不需要与环境主动交互的逆向强化学习方法。
20 術語
子類別
主动逆强化学习
一种IRL方法,其中智能体主动选择要执行的动作,以更好地理解专家的奖励函数。
16 術語
子類別
贝叶斯逆向强化学习
使用贝叶斯推理框架,通过演示数据建模奖励函数不确定性的逆向强化学习方法。
17 術語
子類別
基于偏好的逆向强化学习
一种IRL方法,通过比较轨迹间的偏好而非完整演示来推断奖励函数。
16 術語
子類別
分层逆向强化学习
一种IRL方法,将复杂任务分解为分层子任务,以学习多层次的奖励函数。
12 術語
子類別
多智能体逆向强化学习
将IRL扩展到多智能体交互环境,需要学习集体或个体奖励机制。
18 術語
子類別
深度逆强化学习
利用深度神经网络从高维数据中表示和学习复杂的奖励函数。
12 術語
子類別
对抗性逆向强化学习
使用对抗性游戏技术的IRL框架,其中生成器和判别器相互对抗以学习奖励函数。
15 術語
子類別
逆向强化学习与强化学习
将IRL问题转化为标准RL问题的方法,其中智能体学习最大化演示数据的似然性。
15 術語
子類別
半监督逆向强化学习
结合标记演示与未标记数据以改进奖励学习的IRL方法。
15 術語
子類別
机器人学的逆向强化学习
IRL在机器人和导航中从人类示范学习行为模式的专门应用
9 術語
子類別
基于用户反馈的逆向强化学习
一种主动整合用户定性反馈以迭代优化奖励函数的IRL方法。
15 術語
子類別
合作式逆向强化学习
一种IRL框架,其中人类与AI积极协作,共同定义和优化奖励目标。
19 術語
子類別
逆向强化学习用于规划
利用IRL从现有计划中提取隐含目标,以改进未来的规划系统。
14 術語
子類別
最大熵逆向强化学习
一种优先选择具有最大熵的奖励解决方案的IRL方法,以避免对演示数据的过拟合。
11 術語
🔍