AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
子類別
行为克隆
通过最小化智能体行为与专家演示之间的误差来直接学习策略
17 術語
子類別
逆向强化学习
从专家演示中推断奖励函数,然后学习最优策略。
14 術語
子類別
生成对抗模仿学习
使用对抗网络来区分智能体的行为和专家演示。
18 術語
子類別
数据聚合DAgger
通过询问专家关于当前策略访问的状态来迭代收集数据。
17 術語
子類別
离线模仿学习
从固定的演示集中学习,无需与环境的额外交互
13 術語
子類別
在线模仿学习
具有实时交互和基于新演示更新的持续学习。
15 術語
子類別
通过观察进行模仿
仅通过观察状态和轨迹进行学习,而无法访问专家的动作。
15 術語
子類別
分层模仿学习
将复杂任务分解为子任务,并在不同抽象层次上进行模仿学习。
17 術語
子類別
单次模仿学习
仅通过一次演示就能够模仿新任务的能力
11 術語
子類別
元模仿学习
通过在多个任务上的经验,通过模仿快速学习新任务。
20 術語
子類別
多模态模仿学习
处理具有多个有效解决方案的演示并学习多模态策略。
19 術語
子類別
部分观测下的模仿学习
当演示仅部分覆盖状态空间时的模仿学习
10 術語
🔍