可解释性指标 - AI 术语表

📖

个术语

特征交互强度

量化预测模型中两个或多个特征之间交互效应强度的指标。交互作用通过特征组合效应与特征单独效应之和的差异来衡量。

📖

个术语

Friedman H统计量

基于模型预测部分方差的特征交互定量度量。H统计量范围从0（无交互）到1（强交互），可用于计算成对交互或高阶交互。

📖

个术语

稳定性指标

衡量解释方法在面对输入数据轻微变化时生成解释一致性的指标。良好的稳定性确保相似实例的解释不会随机波动。

📖

个术语

可理解性指数

评估人类理解解释或模型难易程度的综合评分，基于句法复杂度、词汇量和逻辑结构等因素。该指数结合客观和主观的可读性指标。

📖

个术语

可解释性-准确性权衡

模型被人类解释的能力与其原始预测性能之间的反向关系。这种权衡通过各种指标进行量化，以便根据应用领域需求找到最佳平衡点。

📖

个术语

事后可解释性评分

对模型训练后生成解释质量的定量评估，结合保真度、稳定性和可理解性。该综合评分允许在同一模型上比较不同的解释技术。

📖

个术语

内在可解释性度量

基于算法结构而非外部解释来评估模型固有可解释程度的指标。该度量考虑模型的线性、单调性和稀疏性等因素。

📖

个术语

局部保真度指标

衡量局部解释在表示模型实例邻近区域内行为准确性的指标。该指标评估LIME或Anchors等方法中使用的局部近似的有效性。

📖

个术语

解释覆盖率

解释方法能够生成有效且一致解释的数据集比例。覆盖率衡量解释技术的泛化能力及其在特征空间不同区域的适用性。

📖

个术语

基于规则的可解释性评分

专门针对基于规则模型的指标，根据规则数量、平均长度和重叠程度评估解释质量。该评分倾向于简洁、无冗余且易于理解的规则集。

📖

个术语

一致性度量

评估对具有相同或相似预测的实例是否生成相似解释的指标。一致性对于在决策空间的不同区域保持对解释的信任至关重要。

AI 词汇表