🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

特征交互强度

量化预测模型中两个或多个特征之间交互效应强度的指标。交互作用通过特征组合效应与特征单独效应之和的差异来衡量。

📖
个术语

Friedman H统计量

基于模型预测部分方差的特征交互定量度量。H统计量范围从0(无交互)到1(强交互),可用于计算成对交互或高阶交互。

📖
个术语

稳定性指标

衡量解释方法在面对输入数据轻微变化时生成解释一致性的指标。良好的稳定性确保相似实例的解释不会随机波动。

📖
个术语

可理解性指数

评估人类理解解释或模型难易程度的综合评分,基于句法复杂度、词汇量和逻辑结构等因素。该指数结合客观和主观的可读性指标。

📖
个术语

可解释性-准确性权衡

模型被人类解释的能力与其原始预测性能之间的反向关系。这种权衡通过各种指标进行量化,以便根据应用领域需求找到最佳平衡点。

📖
个术语

事后可解释性评分

对模型训练后生成解释质量的定量评估,结合保真度、稳定性和可理解性。该综合评分允许在同一模型上比较不同的解释技术。

📖
个术语

内在可解释性度量

基于算法结构而非外部解释来评估模型固有可解释程度的指标。该度量考虑模型的线性、单调性和稀疏性等因素。

📖
个术语

局部保真度指标

衡量局部解释在表示模型实例邻近区域内行为准确性的指标。该指标评估LIME或Anchors等方法中使用的局部近似的有效性。

📖
个术语

解释覆盖率

解释方法能够生成有效且一致解释的数据集比例。覆盖率衡量解释技术的泛化能力及其在特征空间不同区域的适用性。

📖
个术语

基于规则的可解释性评分

专门针对基于规则模型的指标,根据规则数量、平均长度和重叠程度评估解释质量。该评分倾向于简洁、无冗余且易于理解的规则集。

📖
个术语

一致性度量

评估对具有相同或相似预测的实例是否生成相似解释的指标。一致性对于在决策空间的不同区域保持对解释的信任至关重要。

🔍

未找到结果