🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📂
个子类别

萨顿选项

萨顿引入的基本概念,定义了具有自身策略、进入条件和终止函数的扩展时间动作。

15 个术语
📂
个子类别

MAXQ分解

一种基于任务的层次分解方法,通过构建子任务图并分配价值来结构化问题。

15 个术语
📂
个子类别

HAM(分层抽象机)

分层有限状态机,用于定义抽象策略和子策略以指导学习。

15 个术语
📂
个子类别

FeUdal Networks

受封建主义启发的架构,管理者设定目标,工作者执行底层操作。

8 个术语
📂
个子类别

目标条件强化学习

一种强化学习方法,其中策略通过子目标进行条件化,以促进层次化分解。

15 个术语
📂
个子类别

子目标发现

在状态空间中自动识别和发现相关子目标的无监督技术。

18 个术语
📂
个子类别

时间抽象

通过在不同时间尺度上抽象决策来处理长时间跨度的方法。

19 个术语
📂
个子类别

多任务分层强化学习

在共享共同子任务的多个任务上同时进行分层学习,以实现高效迁移。

14 个术语
📂
个子类别

HRL中的内在动机

利用内在奖励引导自动发现相关层次结构

13 个术语
📂
个子类别

元学习在分层强化学习中的应用

元学习方法用于自动调整分层结构以适应新任务和环境。

13 个术语
📂
个子类别

选项发现方法

基于密度、可达性或瓶颈自动发现有效选项的特定算法。

14 个术语
📂
个子类别

分层策略梯度

适用于层次结构的策略梯度方法,同时优化各层次级别。

10 个术语
📂
个子类别

分层强化学习中的状态抽象

用于简化不同层级表示并加速学习的状态抽象技术

12 个术语
📂
个子类别

终止函数

决定何时终止选项和子任务的函数,对层次结构的效率至关重要。

15 个术语
📂
个子类别

分层行动者-评论家

采用多层级协调的行动者与评论家架构,用于分层学习

12 个术语
🔍

未找到结果