AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
先验概率偏移
目标变量(y)分布的变化,而条件分布P(X|y)保持不变,影响模型预测。
術語
群体稳定性指数(PSI)
量化指标,用于衡量两个数据集(如训练集与生产集)之间的分布差异,用于检测和量化数据漂移。
術語
柯尔莫哥洛夫-斯米尔诺夫(KS)检验
非参数统计检验,比较两个样本的累积分布函数,以确定它们是否来自同一分布。
術語
赫林格距离
两个概率分布之间的相似性度量,取值范围在0到1之间,用于以可解释的方式量化数据漂移的幅度。
術語
漂移检测阈值
为漂移指标(如PSI)预定义的临界值,超出此值时会触发数据退化警报,以便重新评估模型。
術語
参考窗口
用作稳定基准的时间段或数据集,用于比较未来分布并识别数据漂移。
術語
检测窗口
在生产数据上滑动的时间间隔,在其上计算统计数据以与参考窗口进行比较,用于漂移监控。
術語
特征级漂移检测
在每个单独变量(特征)级别分析漂移,以识别分布发生变化的具体特征,便于诊断。
術語
多元漂移检测
一种同时分析多个特征联合分布变化的方法,能够检测到在单变量层面不可见的漂移。
術語
增量漂移检测
随着新数据的到来而更新参考统计量的检测方法,使模型能够适应渐进式变化。
術語
自适应窗口
一种检测窗口大小根据检测到的变化率动态调整的技术,允许对漂移具有不同的响应速度。
術語
漂移根本原因分析
旨在识别数据漂移根本来源的调查过程(例如:流程变更、收集错误、用户行为演变)。
術語
模型重训练触发器
一种自动化条件,通常基于漂移阈值的超出,用于启动机器学习模型的重新训练或更新过程。
術語
机器学习的统计过程控制 (SPC)
将工业质量控制方法(如控制图)应用于模型指标的监控,以实现稳健的漂移检测。
🔍