AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
极值理论
统计学的一个分支,研究分布极值的渐近行为,能够建模和预测大尺度的罕见事件。
个术语
稳健统计
一套对假设违反和极端值具有抵抗力的统计方法,即使在存在污染数据的情况下也能提供可靠的估计。
个术语
温莎化
一种统计转换技术,用指定的分位数替换极端值,从而限制异常观测对分析的影响。
个术语
库克距离
回归分析中的影响力度量,识别对模型估计参数产生不成比例影响的观测值,结合了杠杆效应和残差。
个术语
杠杆点
具有极端预测值的观测点,即使它们符合预期模型,也可能对回归系数产生过度影响。
个术语
崩溃点
统计估计器在产生任意不正确结果之前能够容忍的最小污染比例,用于衡量方法的稳健性。
个术语
DBSCAN聚类
基于密度的聚类算法,能够自动识别任意形状的簇并将噪声点作为极端值。
个术语
格拉布斯检验
用于检测正态分布数据中单个异常值的参数统计检验,基于标准化标准差。
个术语
极端百分位数法
基于分布的上分位数或下分位数识别极端值的方法,通常使用1%或5%的极端值作为阈值。
个术语
中位数绝对偏差
基于绝对中位偏差计算的稳健离散度度量,对极端值具有抵抗力,是标准偏差的替代方法。
个术语
影响观测值
存在或缺失会显著改变统计分析结果的数据点,通过如库克距离等度量进行检测。
个术语
图基围栏法
使用基于四分位距的边界检测极端值的方法,通常1.5*IQR用于中度异常值,3*IQR用于极端异常值。
个术语
肖维涅准则
基于假设正态分布中观测值出现概率的经典统计检验,用于识别异常值。
🔍