LIME方法 - AI 术语表

📖

个术语

模型不可知

一种解释方法，可与任何预测模型配合使用，无需了解其架构或内部参数。不可知方法将模型视为黑箱，仅基于其输入和输出。

📖

个术语

局部解释

解释模型对特定实例的预测而非模型整体行为的解释。局部解释对于理解为何做出特定决策特别有用。

📖

个术语

数据扰动

通过创建原始实例的轻微变体来生成邻近合成数据集的技术。在LIME中，这些扰动用于构建局部简单模型的学习集。

📖

个术语

特征权重

量化指标，表示每个特征在模型局部决策中的相对重要性。这些权重可识别对特定预测最具影响力的因素。

📖

个术语

预测邻域

特征空间中靠近原始实例的数据点集合，用于学习局部简单模型。该邻域的定义对生成解释的相关性至关重要。

📖

个术语

代理模型

简单可解释的模型（如线性回归或决策树），局部近似复杂模型的行为。该模型在扰动数据上训练以生成解释。

📖

个术语

解释保真度

衡量局部简单模型在所考虑邻域内复现复杂模型预测的准确度。高保真度确保解释能真实反映原始模型的行为。

📖

个术语

分段

在LIME中用于解释图像或文本预测的连续数据区域。分段可将相邻像素或词语分组以实现更连贯的解释。

📖

个术语

超像素

共享相似特征（颜色、纹理、强度）的相邻像素组，在LIME中用作图像解释的基本单元。超像素在保留相关视觉信息的同时降低了计算复杂度。

📖

个术语

相似性核

定义原始实例与扰动实例在特征空间中接近程度的数学函数。该核函数在局部模型学习中加权各点的重要性。

📖

个术语

反事实解释

一种解释类型，显示如果某些特征被修改，预测将如何改变。作为LIME的补充，这种方法有助于理解获得不同预测所需的条件。

📖

个术语

解释稳定性

对相似实例或多次运行时生成解释一致性的度量。良好的稳定性对于所产生解释的可信度至关重要。

📖

个术语

影响区域

特征空间中局部解释仍然有效且忠实于复杂模型行为的区域。确定该区域对于评估解释的范围至关重要。

📖

个术语

解释复杂度

局部解释中使用的特征或段的数量，通常受到限制以保持可解释性。为了获得有效的解释，需要在保真度和简洁性之间找到平衡。

📖

个术语

热力图

空间化表示图像不同区域在模型预测中的重要性的可视化。在LIME中，热力图使用相关性分数来突出显示有影响的区域。

AI 词汇表