AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
子類別
交叉验证
一种评估技术,将数据划分为多个子集,通过多次迭代测试模型的泛化能力。
2 術語
子類別
统计检验
用于显著比较不同模型或配置之间性能的正式统计方法。
15 術語
子類別
性能指标
一组定量指标(准确率、召回率、F1分数、平均绝对误差、均方根误差),根据上下文衡量预测质量。
9 術語
子類別
偏差-方差分析
将泛化误差分解为偏差(欠拟合)和方差(过拟合),以优化模型复杂度。
13 術語
子類別
鲁棒性测试
评估预测在面对扰动、噪声和输入数据变化时的稳定性。
13 術語
子類別
时间验证
针对序列数据的特定方法论,训练使用测试之前的时间段以模拟真实条件。
10 術語
子類別
ROC曲线和AUC
用于评估不同决策阈值下二元分类器性能的图形工具和度量指标。
3 術語
子類別
模型校准
调整预测概率,使其准确反映事件实际发生的频率。
6 術語
子類別
公平性测试
评估人口统计偏见及模型在伦理和监管标准下的潜在歧视。
10 術語
子類別
错误分析
系统性检查错误预测以识别失败模式并指导模型改进。
9 術語
子類別
Bootstrap 验证
自助法(Bootstrap):一种通过有放回重采样来估计性能指标变异性和可靠性的技术。
9 術語
子類別
压力测试
评估模型在极端条件或边界情况下的行为,以确定其操作限制。
16 術語
子類別
敏感性测试
分析输入特征变化对预测结果的影响,以了解模型的稳定性。
13 術語
子類別
外部验证
在来自全新来源或分布的数据上测试模型,以评估其泛化能力。
9 術語
子類別
性能退化测试
持续监控生产环境中模型的性能,以检测数据漂移和时间性能退化。
7 術語
🔍