AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个子类别
萨顿选项
萨顿引入的基本概念,定义了具有自身策略、进入条件和终止函数的扩展时间动作。
15 个术语
个子类别
MAXQ分解
一种基于任务的层次分解方法,通过构建子任务图并分配价值来结构化问题。
15 个术语
个子类别
HAM(分层抽象机)
分层有限状态机,用于定义抽象策略和子策略以指导学习。
15 个术语
个子类别
FeUdal Networks
受封建主义启发的架构,管理者设定目标,工作者执行底层操作。
8 个术语
个子类别
目标条件强化学习
一种强化学习方法,其中策略通过子目标进行条件化,以促进层次化分解。
15 个术语
个子类别
子目标发现
在状态空间中自动识别和发现相关子目标的无监督技术。
18 个术语
个子类别
时间抽象
通过在不同时间尺度上抽象决策来处理长时间跨度的方法。
19 个术语
个子类别
多任务分层强化学习
在共享共同子任务的多个任务上同时进行分层学习,以实现高效迁移。
14 个术语
个子类别
HRL中的内在动机
利用内在奖励引导自动发现相关层次结构
13 个术语
个子类别
元学习在分层强化学习中的应用
元学习方法用于自动调整分层结构以适应新任务和环境。
13 个术语
个子类别
选项发现方法
基于密度、可达性或瓶颈自动发现有效选项的特定算法。
14 个术语
个子类别
分层策略梯度
适用于层次结构的策略梯度方法,同时优化各层次级别。
10 个术语
个子类别
分层强化学习中的状态抽象
用于简化不同层级表示并加速学习的状态抽象技术
12 个术语
个子类别
终止函数
决定何时终止选项和子任务的函数,对层次结构的效率至关重要。
15 个术语
个子类别
分层行动者-评论家
采用多层级协调的行动者与评论家架构,用于分层学习
12 个术语
🔍