🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

对抗性测试

一种评估方法,通过将模型暴露于专门设计以引发预测错误的样本中,揭示其对针对性攻击的脆弱性。

📖
个术语

分布偏移检测

识别输入数据分布相对于训练数据发生变化的过程,对于维持模型在生产环境中的性能至关重要。

📖
个术语

压力测试

通过将模型置于极端或异常条件下,对其极限进行密集评估,以识别潜在的失效点。

📖
个术语

扰动分析

系统研究输入数据中微小变化对模型预测的影响,从而衡量其对变化的敏感性。

📖
个术语

鲁棒性指标

用于量化模型对扰动抵抗能力的指标,如在噪声下的准确率或预测的变化程度。

📖
个术语

输入验证

验证输入数据以确保其符合预期约束的过程,保护模型免受恶意或无效输入的影响。

📖
个术语

边界测试

评估模型在决策空间边界处的行为,即预测最可能因轻微扰动而变化的区域。

📖
个术语

模型校准

调整模型的置信度得分,使其精确反映预测正确的实际概率。

📖
个术语

特征重要性稳定性

在数据受到不同扰动的情况下评估特征重要性的一致性,衡量模型可解释性的可靠性。

📖
个术语

领域适应鲁棒性

模型在面对与训练数据略有不同的领域数据时,保持其性能的能力。

📖
个术语

异常值韧性测试

评估模型在处理异常值时,不显著降低其预测性能的能力。

📖
个术语

时间鲁棒性

衡量模型预测在数据模式随时间演变时的稳定性,尤其对时间序列至关重要。

📖
个术语

基于梯度的攻击测试

通过模拟利用模型梯度生成最优扰动,以最大化预测误差的攻击。

🔍

未找到结果