🏠 Accueil
基準測試
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles

AI 詞彙表

人工智能完整詞典

200
類別
2,608
子類別
30,011
術語
📂
子類別

交叉验证

一种评估技术,将数据划分为多个子集,通过多次迭代测试模型的泛化能力。

2 術語
📂
子類別

统计检验

用于显著比较不同模型或配置之间性能的正式统计方法。

15 術語
📂
子類別

性能指标

一组定量指标(准确率、召回率、F1分数、平均绝对误差、均方根误差),根据上下文衡量预测质量。

9 術語
📂
子類別

偏差-方差分析

将泛化误差分解为偏差(欠拟合)和方差(过拟合),以优化模型复杂度。

13 術語
📂
子類別

鲁棒性测试

评估预测在面对扰动、噪声和输入数据变化时的稳定性。

13 術語
📂
子類別

时间验证

针对序列数据的特定方法论,训练使用测试之前的时间段以模拟真实条件。

10 術語
📂
子類別

ROC曲线和AUC

用于评估不同决策阈值下二元分类器性能的图形工具和度量指标。

3 術語
📂
子類別

模型校准

调整预测概率,使其准确反映事件实际发生的频率。

6 術語
📂
子類別

公平性测试

评估人口统计偏见及模型在伦理和监管标准下的潜在歧视。

10 術語
📂
子類別

错误分析

系统性检查错误预测以识别失败模式并指导模型改进。

9 術語
📂
子類別

Bootstrap 验证

自助法(Bootstrap):一种通过有放回重采样来估计性能指标变异性和可靠性的技术。

9 術語
📂
子類別

压力测试

评估模型在极端条件或边界情况下的行为,以确定其操作限制。

16 術語
📂
子類別

敏感性测试

分析输入特征变化对预测结果的影响,以了解模型的稳定性。

13 術語
📂
子類別

外部验证

在来自全新来源或分布的数据上测试模型,以评估其泛化能力。

9 術語
📂
子類別

性能退化测试

持续监控生产环境中模型的性能,以检测数据漂移和时间性能退化。

7 術語
🔍

搵唔到結果