AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
分层行动者-评论者 (HAC)
一种强化学习架构,结合多层次的分层行动者和评论者,通过时间分解来解决复杂任务。
个术语
高层策略
位于层次结构顶端的决策策略,选择子目标或选项来指导低层策略。
个术语
低层策略
层次结构中的基础策略,执行原始动作以实现高层策略定义的子目标。
个术语
子目标
由高层代理定义的中间目标,低层代理必须实现这些目标才能向最终目标推进。
个术语
内部选项策略
在层次框架中,当特定选项处于活动状态时,决定每个时间步要执行的动作的策略。
个术语
封建网络 (FuN)
受封建制度启发的层次架构,其中管理者定义目标方向,工作者执行动作以实现这些目标。
个术语
控制器
低层代理,执行原始动作以完成元控制器指定的子目标。
个术语
分层深度确定性策略梯度 (H-DDPG)
DDPG算法的扩展,集成了分层行动者-评论者结构,用于连续动作空间中的学习。
个术语
多层级演员-评论家
每个层级都拥有自己的演员-评论家对,针对不同时间跨度进行优化的架构。
个术语
分层Q学习
Q学习的一种变体,在不同层级计算Q值以评估选项和原始动作。
个术语
子任务分解
将复杂任务自动分解为更简单、可管理的子任务以进行分层学习的过程。
个术语
端到端分层学习
整个策略层次结构同时训练,无需手动预分解任务的方法。
🔍