🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

分层行动者-评论者 (HAC)

一种强化学习架构,结合多层次的分层行动者和评论者,通过时间分解来解决复杂任务。

📖
个术语

高层策略

位于层次结构顶端的决策策略,选择子目标或选项来指导低层策略。

📖
个术语

低层策略

层次结构中的基础策略,执行原始动作以实现高层策略定义的子目标。

📖
个术语

子目标

由高层代理定义的中间目标,低层代理必须实现这些目标才能向最终目标推进。

📖
个术语

内部选项策略

在层次框架中,当特定选项处于活动状态时,决定每个时间步要执行的动作的策略。

📖
个术语

封建网络 (FuN)

受封建制度启发的层次架构,其中管理者定义目标方向,工作者执行动作以实现这些目标。

📖
个术语

控制器

低层代理,执行原始动作以完成元控制器指定的子目标。

📖
个术语

分层深度确定性策略梯度 (H-DDPG)

DDPG算法的扩展,集成了分层行动者-评论者结构,用于连续动作空间中的学习。

📖
个术语

多层级演员-评论家

每个层级都拥有自己的演员-评论家对,针对不同时间跨度进行优化的架构。

📖
个术语

分层Q学习

Q学习的一种变体,在不同层级计算Q值以评估选项和原始动作。

📖
个术语

子任务分解

将复杂任务自动分解为更简单、可管理的子任务以进行分层学习的过程。

📖
个术语

端到端分层学习

整个策略层次结构同时训练,无需手动预分解任务的方法。

🔍

未找到结果