AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
离线多任务强化学习
一种学习范式,从固定的批量数据集中同时学习多个不同任务的策略,无需与环境进行交互。
術語
批量多任务学习
一种方法,智能体仅使用预先收集的数据学习解决多个任务,在训练期间不进行在线探索。
術語
共享数据集策略优化
使用共同经验数据池优化多个策略的技术,以提高任务间的学习效率。
術語
任务无关表示学习
从批量数据中学习可泛化的状态-动作表示的过程,无需了解未来任务的具体信息。
術語
保守多任务策略优化
确保多任务策略不会显著偏离批量数据集中观察到的行为的方法,以避免输出分布的支持问题。
術語
多任务批量约束Q学习
BCQ在多任务背景下的扩展,其中Q函数受批量数据约束,同时在任务间共享知识。
術語
多任务分布式强化学习
在多任务离线背景下,为每个任务建模完整回报分布而非期望值的框架。
術語
离线多任务元学习
从多任务批量数据集中学习元知识,以便能够用少量数据快速适应新任务。
術語
任务解耦
将任务特定表示与共享知识分离的技术,以优化离线多任务学习。
術語
多任务离线评估指标
评估多任务策略性能的特定度量方法,无需交互,如多任务FQE或加权重要性采样。
術語
任务特定策略头
在离线多任务学习中,具有共享主干网络和每个任务独立输出头的网络架构。
術語
多任务离线数据效率
衡量批量数据用于学习多个策略相对于单任务学习的效率。
術語
跨任务知识迁移
从共享批量数据集中学习时,在不同任务间自动传输有用知识的过程。
術語
多任务离线价值函数分解
将价值函数分解为共享和任务特定组件,以改进离线多任务学习。
術語
离线设置中的任务聚类
基于批量数据自动聚类相似任务,以优化知识共享和资源分配。
術語
多任务离线探索-利用权衡
适应离线环境的权衡问题,管理现有数据使用与控制外推之间的平衡以处理多个任务。
術語
共享动态模型
从多任务批量数据中学习的单一转换模型,捕捉环境的共同和特定动态。
術語
多任务离线课程学习
在离线训练期间根据任务难度和相互依赖性自动排序任务以优化学习。
🔍