🏠 Accueil
基準測試
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles

AI 詞彙表

人工智能完整詞典

200
類別
2,608
子類別
30,011
術語
📖
術語

模型回归测试

自动化程序,用于验证新模型或新的管道版本在固定的测试数据集上,其性能不会相较于基准版本有所下降。

📖
術語

数据漂移验证

自动化测试,通过比较新的生产数据与训练数据的统计分布,来检测可能影响模型性能的显著变化。

📖
術語

偏见测试

一套自动化程序,用于测量和量化模型对特定人口亚群的系统性偏见,以确保算法的公平性和伦理性。

📖
術語

合规测试

自动化验证,确保模型及其数据遵守现行的法规和标准,例如用于个人数据保护的GDPR(通用数据保护条例)。

📖
術語

延迟性能测试

在负载条件下,自动化测量模型的响应时间,以确保其满足生产环境应用的实时要求。

📖
術語

特征一致性验证

自动化测试,确保由流水线计算的特征遵守模型所期望的模式、类型和值范围约束。

📖
術語

流水线稳定性测试

对ML流水线(预处理、训练、推理)的所有步骤进行自动化验证,以确保其能够确定性地、无错误地运行。

📖
術語

对抗安全性测试

自动化评估模型对于对抗性攻击的脆弱性,这些攻击通过对抗样本诱导模型做出错误预测。

📖
術語

单调性测试

自动化检查模型中特征和预测之间的单调关系,确保特征的增加确实导致预测值的上升(或下降)。

📖
術語

数据质量验证

一系列自动化测试,检查原始数据在被摄入训练或推理管道之前的完整性、唯一性、有效性和一致性。

📖
術語

指标退化测试

持续监控系统,如果模型性能指标(如F1分数、AUC)在生产数据上降至预定义阈值以下,则触发警报。

📖
術語

模型集成测试

自动化验证训练模型与系统其他组件(如API、数据库和监控服务)之间的正确交互。

📖
術語

影子测试

一种技术,其中新模型与生产模型并行部署,接收相同的实际流量但不影响用户,以便在切换前比较它们的性能。

📖
術語

实验可重复性测试

通过使用固定的随机种子运行相同管道来检查训练结果的可重复性,确保变化是微小且可控的。

📖
術語

ML模型金丝雀测试

部署策略,其中新版本模型暴露于生产环境中的一小部分用户流量,允许在全面部署前进行真实条件下的验证。

📖
術語

管道依赖测试

自动化验证ML管道所需的所有库、软件版本和外部资源在目标执行环境中都存在且兼容。

🔍

搵唔到結果