可解释性的定量评估

📖

術語

稳定性

衡量为相似实例或同一实例在数据有轻微变化时所生成解释的一致性。低稳定性可能表示解释不够稳健或模型不稳定。

📖

術語

不忠实度

一种量化解释模型梯度与黑盒模型梯度之间差异的度量标准。它衡量解释正确捕捉模型对输入变化的敏感度的能力。

📖

術語

解释复杂度

衡量解释的简洁性或简明性的指标，通常通过规则数量、特征数量或非零项的数量来评估。较低的复杂度有助于人类更好地理解。

📖

術語

鲁棒性得分

量化评估解释在面对输入数据的对抗性扰动时的变化程度。高分意味着解释能很好地抵抗攻击和噪声。

📖

術語

忠实度曲线下面积 (AUC-Fidelity)

一种聚合度量，计算忠实度曲线下的面积，该曲线是相对于邻域大小或所用特征数量的函数。它可用于比较不同解释方法的整体性能。

📖

術語

局部预测差值

对于特定实例，黑盒模型的预测与解释模型的预测之间的绝对差异。该指标评估局部近似的准确性。

📖

術語

压缩率

原始模型中的特征数量与简化解释中的特征数量之间的比率。它量化了解释相对于完整模型的简化程度。

📖

術語

解释的一致性

衡量为同一类别的不同实例或邻近实例生成的解释之间的逻辑一致性。它评估解释系统的整体一致性。

📖

術語

解释损失函数

用于优化解释模型参数的数学目标函数。它通常平衡对原始模型的忠实度和解释的复杂性。

📖

術語

噪声敏感性

量化当向输入数据添加随机噪声时解释变化的度量。低噪声敏感性对于可靠的解释是可取的。

📖

術語

解释单调性

衡量解释中特征重要性是否与输入值的单调变化一致变化的属性。它确保解释的方向一致性。

📖

術語

重构误差

评估解释重建原始模型行为能力的度量，通常通过预测之间的均方误差来测量。对于基于模型蒸馏的方法至关重要。

📖

術語

选择性指数

量化解释方法专注于给定预测最相关特征能力的度量。高指数表示更好地识别关键变量。

📖

術語

归一化保真度分数

缩放到0和1之间的保真度度量，便于不同模型和解释方法之间的比较。它允许对解释质量进行标准化评估。

📖

術語

特征消融评估协议

系统方法论，通过测量当被识别为重要的特征被移除或遮蔽时对模型性能的影响来评估解释的质量。

📖

術語

完整性度量

量化评估，测量解释是否捕获了对特定预测做出贡献的所有相关因素。它与部分或不完整的解释相对。

📖

術語

解释方差 (Explanation Variance)

对同一实例多次运行时生成解释的离散程度的统计度量。低方差对于解释的可重复性和可靠性至关重要。

AI 詞彙表

稳定性