可解释性评估 - AI 术语表

📖

个术语

认知可理解性

基于认知心理学和工效学原理，定性评估人类解释和理解生成解释的便利程度。

📖

个术语

特征相关性

量化解释中强调的特征与模型决策过程中实际有影响力的特征之间的匹配度。

📖

个术语

解释内一致性

检查同一解释内是否存在逻辑矛盾，确保不同元素能够以连贯和相互兼容的方式衔接。

📖

个术语

解释特异性

解释在识别特定预测独特因素方面的精确程度，避免过度概括或通用解释。

📖

个术语

可解释性公理

任何解释方法都应遵循的基本数学原则集合，如解释的敏感性、不变性或单调性。

📖

个术语

解释置信度分数

量化特定解释相关确定性程度的度量，独立于模型对其原始预测的置信度。

📖

个术语

可解释混淆矩阵

传统混淆矩阵的扩展，集成了可解释性指标，以同时评估模型的预测性能和解释质量。

📖

个术语

解释语义相似性

评估同一预测的不同解释之间概念接近度的度量，用于量化解释方法的收敛性或发散性。

📖

个术语

多方评估

涉及不同利益相关者（领域专家、最终用户、监管机构）的解释评估方法论，用于从不同角度衡量其实用价值。

📖

个术语

功能性适配测试

验证解释是否能有效帮助用户完成特定任务（偏差检测、错误纠正、决策制定）的实验协议。

📖

个术语

可操作性度量

量化解释建议具体可行行动以修改或改进模型结果能力的指标，超越简单的被动描述。

📖

个术语

解释性验证模拟

通过系统性地修改解释所识别的特征来实证验证其对模型决策预测影响的评估技术。

AI 词汇表