多目标价值函数 - AI 术语表

📖

个术语

多目标状态值向量

一种向量表示，其中每个分量对应于根据特定目标对某个状态的估计值，从而允许同时评估多个性能标准。

📖

个术语

多目标值函数

一种数学函数，它将每个状态-动作对与一个预期奖励向量相关联，从而捕获不同冲突目标之间的权衡。

📖

个术语

帕累托超平面

目标空间中的一个向量子空间，它定义了被支配解与非支配解之间的边界，并作为多目标优化的参考。

📖

个术语

帕累托前沿

一组有效解的集合，其中任何一个目标的改进都必然会导致至少另一个目标的退化，代表了多目标最优性。

📖

个术语

帕累托最优解

多目标语境下的最优解，指无法在不使至少一个其他目标恶化的情况下改进任何一个目标的解，它表征了有效解。

📖

个术语

线性聚合算子

一种数学算子，它使用预定义的权重线性地组合不同目标的值，从而将多目标问题转化为标量问题。

📖

个术语

标量化函数

一种数学变换，它将目标向量转换为单一的标量值，以便于比较和优化多目标解。

📖

个术语

多目标探索-利用困境

一个复杂问题，其中发现新动作与利用已知动作之间的平衡，必须为所有被考虑的目标同时进行管理。

📖

个术语

权重法

多目标优化技术，为每个目标分配相对权重，以指导搜索朝向帕累托前沿的特定解。

📖

个术语

多目标纳什均衡

扩展到多目标博弈的均衡概念，其中每个智能体根据自身偏好优化效用向量，同时考虑其他智能体的策略。

📖

个术语

切比雪夫算子

使用切比雪夫范数组合目标的聚合函数，优先优化最差目标并保证达到任何帕累托解。

📖

个术语

多目标随机策略

概率决策策略，其中动作概率同时根据多个目标进行优化，允许灵活管理权衡关系。

📖

个术语

多目标奖励矩阵

存储与每个状态-动作转换相关的向量奖励的数据结构，每个维度对应一个特定目标。

📖

个术语

价值函数分解

将向量价值函数分解为标量子函数的技术，以促进多目标学习和优化。

📖

个术语

词典选择法

按照绝对优先级对目标进行排序的优化方法，其中一个目标的优化只考虑所有前面目标的最优解。

📖

个术语

目标层次化

在不同目标之间建立优先级结构的过程，以指导优化朝向与决策者偏好一致的解决方案。

📖

个术语

多目标收敛

算法保证生成的解随着迭代次数增加而收敛到帕累托前沿或有效解子集的特性。

📖

个术语

多目标稳定性

学习算法在面对环境变化或干扰时，在所有目标上保持一致性能的能力。

AI 词汇表