AI 词汇表
人工智能完整词典
基于模型的迁移学习
一种技术,将在源环境中学到的动态模型用于加速目标环境中的学习,通过转移世界结构的知识而非直接转移策略。
可迁移动态模型
环境状态转换的数学表示,设计为可在共享物理或结构特征的不同任务或环境之间重复使用。
基于模型的强化学习
智能体构建环境内部模型以规划和模拟轨迹,然后在现实世界中行动的范式,从而减少昂贵的交互需求。
模型泛化
动态模型对训练期间未观察到的状态或动作做出准确预测的能力,对于环境间成功迁移至关重要。
模型迁移偏差
当在源环境上学习的模型应用于具有略微不同动态的目标环境时引入的系统误差,需要适应性技术。
模型元学习
通过优化模型的初始化参数,学习能够用少量数据快速适应新环境的动态模型的方法。
潜在环境编码
在潜在空间中对环境基本特征的紧凑表示,能够捕获不同环境间的相似性以促进模型迁移。
迁移模型校准
调整迁移模型预测以匹配目标环境统计特征的过程,通常通过回归或贝叶斯自适应技术实现。
多模型迁移
一种策略,使用在不同源环境中学习的一组专门模型,组合起来在目标环境中形成鲁棒的混合模型。
因子化任务空间
将环境之间的差异分解为独立因子,允许选择性迁移相关模型组件,同时调整其他组件。
分层模型强化学习
一种架构,其中不同时间或空间尺度的动力学模型被迁移,允许在新环境中进行有效的分层规划。
模型知识蒸馏
一种压缩技术,大型源动力学模型将其预测教给更紧凑、可迁移的模型,保持泛化能力。
动力学模型领域适应
一组方法,旨在调整预训练的动力学模型以在新领域工作,最小化源分布和目标分布之间的差异。
模型零样本迁移
动力学模型在全新环境中无需任何适应即可运行的能力,通过学习结构的极端泛化实现。
转移图模型
将环境动态表示为图,其中节点是状态,边是概率转移,促进在相似环境之间转移结构。
模型持续学习
一种范式,其中动力学模型在与新环境交互时持续更新,同时保留先前获得的知识。
模型组合迁移
将在简单子任务上学习的基础模型组合,形成能够处理新复合环境的复杂模型的方法。
迁移中的认知不确定性
由于在源环境中未探索的状态空间区域缺乏知识而产生的模型不确定性量化,对于安全迁移至关重要。
混合神经符号模型
结合神经网络学习复杂动力学与表示基本物理约束的可迁移符号组件的架构。
模型跨时间迁移
将在某一时间尺度上学习的动力学模型应用于目标环境中的不同时间尺度有效运行。