AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
基于选项的分层强化学习
使用选项作为时间基元的分层强化学习方法,用于将策略结构化为可重用的子任务。
个术语
选项发现
基于环境结构特征,无需显式监督自动识别和创建相关选项的过程。
个术语
基于密度的选项发现
在状态高密度区域识别选项的方法,这些区域中智能体停留时间显著长于其他区域。
个术语
基于可达性的选项发现
基于从不同起点有效到达特定目标状态集的能力来创建选项的技术。
个术语
基于瓶颈的选项发现
在连接状态空间不同区域的关键通道或瓶颈状态处识别选项的方法。
个术语
内部选项策略
定义智能体在执行选项期间行为的策略,指定每个时间步要采取的动作。
个术语
选项终止
确定选项何时应停止并将控制权返回给上层策略的机制。
个术语
目标条件选项
由特定目标参数化的选项,允许在不同任务上下文中灵活重用。
个术语
特征选项
通过转移矩阵的特征值分解自动发现的选项,捕捉主导的动态模式。
个术语
后继特征
预测未来状态出现的表示方法,用于在相似任务间发现可迁移的选项。
个术语
状态访问频率
统计每个状态被访问次数的度量,作为识别选项发现相关区域的指标。
个术语
瓶颈状态
智能体必须通过的关键状态才能到达状态空间的不同区域,是理想的选项终止点。
个术语
基于图的选项发现
分析状态转移图结构以识别相关路径和子图作为选项候选的方法。
个术语
覆盖选项
确保状态空间中每个状态至少能被一个选项到达的选项集合,保证完全覆盖。
🔍