AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
多级策略优化
使用同步梯度调整多层分层策略参数的协调优化过程,以最大化整体奖励。
个术语
嵌套策略网络
将低层策略嵌套在高层策略中的神经网络架构,实现决策和行动的分层分解。
个术语
选项框架
层次结构中扩展临时行为的数学形式化,每个选项结合了内部选项策略、启动条件和终止条件。
个术语
子策略选择
高层策略根据当前状态和待达目标动态选择激活哪个子策略的机制。
个术语
原始动作
在环境中直接执行的最底层基本动作,构成由层次结构构建的复杂行为的基础构件。
个术语
分层优势估计
考虑层次结构的优势估计技术,评估每个层级对整体性能提升的贡献。
个术语
跨层级梯度流
通过不同层级传播梯度的机制,确保整个架构的协调稳定优化。
个术语
分层熵正则化
根据层级施加不同熵惩罚的正则化技术,在每个尺度上平衡探索与利用。
个术语
多时间尺度学习
一种学习范式,其中不同层次结构以不同的时间尺度运行,有效管理短期和长期决策。
个术语
分层价值函数
分层结构化的价值函数,估计不同时间抽象层次上的预期回报,以指导策略学习。
🔍