HRL中的内在动机 - AI 术语表

📖

个术语

内在动机

一种自主学习机制，智能体基于自身的好奇心或掌握欲望产生内部奖励，独立于环境的外部奖励。

📖

个术语

内在奖励

由智能体自身生成的奖励信号，用于鼓励探索和学习新技能，通常基于新颖性、惊喜感或进展程度。

📖

个术语

好奇心驱动学习

一种学习方法，智能体受好奇心驱动，通过测量其世界模型的预测误差来生成探索性的内在奖励。

📖

个术语

赋权

一种信息度量，量化智能体对其环境的控制能力，用作内在奖励以鼓励学习有影响力的技能。

📖

个术语

分层策略

多层次决策架构，高层策略选择选项或子任务，低层策略执行相应的原始动作。

📖

个术语

内在动机模块

专门用于计算内在奖励的计算组件，基于新颖性、赋权或掌握进展等多种指标。

📖

个术语

探索-利用困境

强化学习中的基本问题，涉及平衡探索新可能性和利用已获得知识之间的权衡。

📖

个术语

HRL中的元学习

学习自动调整分层结构和内在动机的机制，以优化在新任务上的学习效率。

📖

个术语

抽象状态表示

环境的简化状态表示，捕捉用于分层决策和子目标发现的基本信息。

📖

个术语

目标生成

基于内在动机自主创建中间目标的过程，用于指导探索和构建分层学习结构。

📖

个术语

内在奖励塑造

通过添加内在信号动态修改奖励函数，以加速收敛并提高学习效率。

📖

个术语

自主目标设定

智能体无需外部干预即可自行定义目标的能力，使用内在动机机制来指导其发展。

📖

个术语

层次结构发现

基于状态转换和内在奖励分析，自动识别解决任务的最优层次结构的过程。

AI 词汇表