🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

期望校准误差 (ECE)

加权指标,通过将预测划分为置信区间并测量置信度与准确度之间的差异来计算平均校准误差。

📖
个术语

最大校准误差 (MCE)

识别所有置信区间中置信度与准确度之间最差不一致情况的指标,用于评估极端风险。

📖
个术语

可靠性图

图形可视化,比较预测概率(置信度)与经验频率(准确度),以视觉方式评估模型的校准。

📖
个术语

直方图分箱

校准方法,将预测分数离散化为区间,并用相应类别的经验频率替换每个分数。

📖
个术语

Beta校准

参数化技术,使用Beta回归函数来建模原始分数与校准概率之间的关系,适用于二元预测。

📖
个术语

狄利克雷校准

Beta校准的多类别扩展,使用狄利克雷分布同时校准所有具有相互依赖关系的类别。

📖
个术语

逻辑校准

基于逻辑回归调整预测概率的参数化方法族,包括Platt缩放作为特例。

📖
个术语

按类别校准

对多类别问题的每个类别分别进行校准,与同时考虑所有类别的全局校准不同。

📖
个术语

顶级标签校准

针对最高概率预测的特定校准,在只使用最佳预测的系统中尤为重要。

📖
个术语

后验校准

调整后验概率的过程,使其与给定输入特征的真实条件分布相匹配。

📖
个术语

自适应校准

动态适应变化数据分布的校准方法,持续重新调整校准参数。

📖
个术语

多类校准

将二进制校准技术扩展到多类问题,需要同时对多个类别的概率分布进行校准。

🔍

未找到结果