想象学习

📖

術語

一种强化学习技术，智能体使用内部模型在脑海中模拟场景并生成经验，无需与环境进行实际交互。这种方法通过在实际执行前虚拟探索行动轨迹来加速学习。

📖

術語

心智规划

智能体在选择最佳执行方案前，在脑海中探索和评估不同行动序列的认知过程。该技术使用内部模型来预测未来的后果，无需实际的交互成本。

📖

術語

环境模拟

使用学习模型人工生成环境体验，以创建额外的训练数据。这种方法可以大量增加用于智能体训练的可用数据。

📖

術語

人工智能梦境

人工智能智能体在不活跃期间生成和处理想象状态序列以巩固其学习的过程。这些模拟的梦境可以在不与环境交互的情况下提高模型的鲁棒性。

📖

術語

想象经验

智能体通过心理模拟生成的数据，作为真实经验的补充用于训练。这些合成经验遵循与真实交互相同的结构，但由内部模型产生。

📖

術語

想象轨迹

智能体使用其环境内部模型模拟的状态-动作-奖励序列。这些虚拟轨迹允许探索替代策略，无需真实风险或成本。

📖

術語

想象缓冲区

存储由想象生成的经验以供智能体后续训练的内存空间。该缓冲区与真实经验缓冲区并行运行，以丰富训练语料库。

📖

術語

内在好奇心

内部动机机制，推动智能体探索其环境模型中的未知或不可预测状态。这种好奇心将想象力引导至信息丰富的场景以改进模型。

📖

術語

模型引导探索

一种探索策略，利用内部模型的预测来识别最值得尝试的行动。智能体优先考虑那些导向高不确定性或高奖励潜力的状态的模拟。

📖

術語

虚拟试错学习

智能体在模拟中测试行动以从其后果中学习，而无需真实互动，从而改进策略的过程。该方法消除了与物理探索相关的成本和风险。

📖

術語

未来状态预测

内部模型提前多个时间步预测环境未来状态的能力。这种多步预测对于有效的想象式规划至关重要。

📖

術語

环境动态

对学习环境中状态间转换规则的数学建模。准确理解此动态对于逼真的想象式模拟至关重要。

📖

術語

想象推演

仅使用内部模型和候选策略，从给定状态开始模拟完整轨迹的过程。想象推演能够快速评估不同行动策略的质量。

AI 詞彙表