AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个子类别
POMDP (部分可观察马尔可夫决策过程)
正式的数学框架,用于建模智能体只能感知系统真实状态的部分观察的环境。
13 个术语
个子类别
信念状态
基于智能体观测和动作历史的系统可能状态的概率表示。
13 个术语
个子类别
粒子滤波器
一种使用加权样本的序贯估计方法,用于近似POMDP中的信念分布。
12 个术语
个子类别
部分可观测Q学习
适用于完整状态无法直接观察的环境的Q学习算法扩展
16 个术语
个子类别
用于POMDP的循环神经网络
使用内部记忆来维持决策所需历史信息的神经网络架构
13 个术语
个子类别
POMDP中的探索
专为处理部分可观测环境中的状态不确定性而设计的探索策略
16 个术语
个子类别
层次强化学习用于POMDP
将复杂的POMDP问题分解为层次子任务以提高学习效率的方法
20 个术语
个子类别
基于内存的模型
使用显式外部内存来存储和检索相关历史信息的系统
10 个术语
个子类别
部分可观察多智能体学习
将POMDP扩展到多个智能体在部分可观察环境中交互的场景。
17 个术语
个子类别
POMDP的策略近似
用于在高维信念状态空间中计算最优或次优策略的近似方法。
19 个术语
个子类别
深度POMDP
深度学习与POMDP的结合,用于处理复杂和高维度的环境。
17 个术语
个子类别
面向POMDP的Transformer
在部分可观测环境中应用Transformer架构来建模长期时间依赖
9 个术语
🔍