AI 词汇表
人工智能完整词典
频率分布
对定量或定性变量的每个值或类别出现次数的表格或图形表示,用于可视化数据的结构。
直方图
由连续条形组成的图表,表示连续定量变量的分布,其中每个条形的面积与对应区间内观测值的频率成比例。
箱线图
通过五个指标(最小值、第一四分位数、中位数、第三四分位数和最大值)综合表示变量分布的统计图表,揭示对称性和异常值的存在。
四分位数
将有序数据集分成四个相等部分的值,其中Q1代表第25百分位数,Q2代表中位数(第50百分位数),Q3代表第75百分位数。
标准差
作为方差平方根计算的离散度度量,量化观测值围绕分布均值的平均离散程度。
方差
与均值偏差平方的平均值,测量数据的离散度,是单变量分析中标准差计算的基础。
算术平均数
通过所有观测值的总和除以其总数得到的中枢趋势指标,对极端值敏感,适用于对称数据。
中位数
将有序分布分成两个相等部分的中心值,对极端值具有稳健性,对于不对称分布特别具有信息价值。
众数
在分布中出现频率最高的值或类别,根据数据结构可能唯一、多个或不存在。
极差
基本的离散度度量,计算为变量的最大值与最小值之差,提供对数据变异性的初步评估。
变异系数
标准差与均值的比率,以百分比表示,用于在单变量分析中比较不同尺度变量的相对离散度。
偏度
衡量分布相对于其对称性的倾斜程度的偏度系数,区分左偏(负)和右偏(正)分布。
条形图
定性或离散定量变量的图形表示,其中每个条形的高度与每个类别的频率或频数成比例。
饼图
按定性变量的相对频率比例分割成扇形角度的图表,以百分比形式可视化整体的构成。
密度图
平滑曲线,估计连续变量的概率密度函数,提供直方图的替代可视化方法,用于识别众数和分布形状。
四分位距
稳健的离散度度量,计算为第三四分位数与第一四分位数之差(Q3-Q1),代表包含50%中心观测值的范围。
皮尔逊偏度系数
基于均值和中位数之差的偏度指标,通过标准差进行标准化,提供了一种特别直观的偏度替代测量方法。
异常值
显著偏离数据总体模式的极端观测值,可通过四分位距法(1.5×IQR)或Z分数等方法进行识别。