多目标策略 - AI 术语表

📖

个术语

多目标值函数

传统值函数的向量扩展，分别估计每个目标的预期回报。允许根据多个标准同时评估策略的性能。

📖

个术语

平衡策略

决策策略，在不同对立目标之间随时间保持稳定的权衡。代表目标冲突环境中的可持续解决方案。

📖

个术语

奖励向量

多维数据结构，包含每个交互步骤中每个目标的奖励值。构成多目标强化学习系统中的基本反馈元素。

📖

个术语

帕累托前沿

完整的非支配解集，代表目标之间所有可能的最佳权衡。可视化多目标强化学习中的候选解决方案空间。

📖

个术语

多目标随机策略

根据不同权重同时优化多个目标的动作概率分布。允许在决策过程中探索目标间的各种权衡。

📖

个术语

权重超平面

定义在标量化中每个目标相对权重的向量子空间。确定多目标空间中的优化方向。

📖

个术语

多目标动作空间

每个动作可能对每个考虑的目标产生不同影响的结构。需要专门的算法来管理多标准决策的复杂性。

📖

个术语

标量化强化学习

通过不同的标量化方法将多目标问题转换为一系列单目标问题的范式。允许使用标准算法发现帕累托集。

📖

个术语

多目标凸优化

一类问题，其中目标函数是凸的，保证了解的最优性具有很强的理论性质。有助于多目标策略的收敛性和分析。

📖

个术语

超体积度量

衡量一组解决方案在目标空间中支配体积的绩效指标。能够定量比较多目标策略集。

📖

个术语

多目标上下文策略

一种方法，其中目标权重取决于环境背景或状态。允许根据遇到的情况进行精细的权衡调整。

AI 词汇表