🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

基于选项的分层强化学习

使用选项作为时间基元的分层强化学习方法,用于将策略结构化为可重用的子任务。

📖
个术语

选项发现

基于环境结构特征,无需显式监督自动识别和创建相关选项的过程。

📖
个术语

基于密度的选项发现

在状态高密度区域识别选项的方法,这些区域中智能体停留时间显著长于其他区域。

📖
个术语

基于可达性的选项发现

基于从不同起点有效到达特定目标状态集的能力来创建选项的技术。

📖
个术语

基于瓶颈的选项发现

在连接状态空间不同区域的关键通道或瓶颈状态处识别选项的方法。

📖
个术语

内部选项策略

定义智能体在执行选项期间行为的策略,指定每个时间步要采取的动作。

📖
个术语

选项终止

确定选项何时应停止并将控制权返回给上层策略的机制。

📖
个术语

目标条件选项

由特定目标参数化的选项,允许在不同任务上下文中灵活重用。

📖
个术语

特征选项

通过转移矩阵的特征值分解自动发现的选项,捕捉主导的动态模式。

📖
个术语

后继特征

预测未来状态出现的表示方法,用于在相似任务间发现可迁移的选项。

📖
个术语

状态访问频率

统计每个状态被访问次数的度量,作为识别选项发现相关区域的指标。

📖
个术语

瓶颈状态

智能体必须通过的关键状态才能到达状态空间的不同区域,是理想的选项终止点。

📖
个术语

基于图的选项发现

分析状态转移图结构以识别相关路径和子图作为选项候选的方法。

📖
个术语

覆盖选项

确保状态空间中每个状态至少能被一个选项到达的选项集合,保证完全覆盖。

🔍

未找到结果