AI 词汇表
人工智能完整词典
模型不可知
一种解释方法,可与任何预测模型配合使用,无需了解其架构或内部参数。不可知方法将模型视为黑箱,仅基于其输入和输出。
局部解释
解释模型对特定实例的预测而非模型整体行为的解释。局部解释对于理解为何做出特定决策特别有用。
数据扰动
通过创建原始实例的轻微变体来生成邻近合成数据集的技术。在LIME中,这些扰动用于构建局部简单模型的学习集。
特征权重
量化指标,表示每个特征在模型局部决策中的相对重要性。这些权重可识别对特定预测最具影响力的因素。
预测邻域
特征空间中靠近原始实例的数据点集合,用于学习局部简单模型。该邻域的定义对生成解释的相关性至关重要。
代理模型
简单可解释的模型(如线性回归或决策树),局部近似复杂模型的行为。该模型在扰动数据上训练以生成解释。
解释保真度
衡量局部简单模型在所考虑邻域内复现复杂模型预测的准确度。高保真度确保解释能真实反映原始模型的行为。
分段
在LIME中用于解释图像或文本预测的连续数据区域。分段可将相邻像素或词语分组以实现更连贯的解释。
超像素
共享相似特征(颜色、纹理、强度)的相邻像素组,在LIME中用作图像解释的基本单元。超像素在保留相关视觉信息的同时降低了计算复杂度。
相关性分数
分配给每个特征或段的数值,表示其对局部预测的影响。该分数能够对模型决策中最重要的元素进行优先级排序。
相似性核
定义原始实例与扰动实例在特征空间中接近程度的数学函数。该核函数在局部模型学习中加权各点的重要性。
反事实解释
一种解释类型,显示如果某些特征被修改,预测将如何改变。作为LIME的补充,这种方法有助于理解获得不同预测所需的条件。
解释稳定性
对相似实例或多次运行时生成解释一致性的度量。良好的稳定性对于所产生解释的可信度至关重要。
影响区域
特征空间中局部解释仍然有效且忠实于复杂模型行为的区域。确定该区域对于评估解释的范围至关重要。
解释复杂度
局部解释中使用的特征或段的数量,通常受到限制以保持可解释性。为了获得有效的解释,需要在保真度和简洁性之间找到平衡。
热力图
空间化表示图像不同区域在模型预测中的重要性的可视化。在LIME中,热力图使用相关性分数来突出显示有影响的区域。