🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📂
个子类别

POMDP (部分可观察马尔可夫决策过程)

正式的数学框架,用于建模智能体只能感知系统真实状态的部分观察的环境。

13 个术语
📂
个子类别

信念状态

基于智能体观测和动作历史的系统可能状态的概率表示。

13 个术语
📂
个子类别

粒子滤波器

一种使用加权样本的序贯估计方法,用于近似POMDP中的信念分布。

12 个术语
📂
个子类别

部分可观测Q学习

适用于完整状态无法直接观察的环境的Q学习算法扩展

16 个术语
📂
个子类别

用于POMDP的循环神经网络

使用内部记忆来维持决策所需历史信息的神经网络架构

13 个术语
📂
个子类别

POMDP中的探索

专为处理部分可观测环境中的状态不确定性而设计的探索策略

16 个术语
📂
个子类别

层次强化学习用于POMDP

将复杂的POMDP问题分解为层次子任务以提高学习效率的方法

20 个术语
📂
个子类别

基于内存的模型

使用显式外部内存来存储和检索相关历史信息的系统

10 个术语
📂
个子类别

部分可观察多智能体学习

将POMDP扩展到多个智能体在部分可观察环境中交互的场景。

17 个术语
📂
个子类别

POMDP的策略近似

用于在高维信念状态空间中计算最优或次优策略的近似方法。

19 个术语
📂
个子类别

深度POMDP

深度学习与POMDP的结合,用于处理复杂和高维度的环境。

17 个术语
📂
个子类别

面向POMDP的Transformer

在部分可观测环境中应用Transformer架构来建模长期时间依赖

9 个术语
🔍

未找到结果