🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

内在动机

一种自主学习机制,智能体基于自身的好奇心或掌握欲望产生内部奖励,独立于环境的外部奖励。

📖
个术语

内在奖励

由智能体自身生成的奖励信号,用于鼓励探索和学习新技能,通常基于新颖性、惊喜感或进展程度。

📖
个术语

好奇心驱动学习

一种学习方法,智能体受好奇心驱动,通过测量其世界模型的预测误差来生成探索性的内在奖励。

📖
个术语

赋权

一种信息度量,量化智能体对其环境的控制能力,用作内在奖励以鼓励学习有影响力的技能。

📖
个术语

分层策略

多层次决策架构,高层策略选择选项或子任务,低层策略执行相应的原始动作。

📖
个术语

内在动机模块

专门用于计算内在奖励的计算组件,基于新颖性、赋权或掌握进展等多种指标。

📖
个术语

探索-利用困境

强化学习中的基本问题,涉及平衡探索新可能性和利用已获得知识之间的权衡。

📖
个术语

HRL中的元学习

学习自动调整分层结构和内在动机的机制,以优化在新任务上的学习效率。

📖
个术语

抽象状态表示

环境的简化状态表示,捕捉用于分层决策和子目标发现的基本信息。

📖
个术语

目标生成

基于内在动机自主创建中间目标的过程,用于指导探索和构建分层学习结构。

📖
个术语

内在奖励塑造

通过添加内在信号动态修改奖励函数,以加速收敛并提高学习效率。

📖
个术语

自主目标设定

智能体无需外部干预即可自行定义目标的能力,使用内在动机机制来指导其发展。

📖
个术语

层次结构发现

基于状态转换和内在奖励分析,自动识别解决任务的最优层次结构的过程。

🔍

未找到结果