AI 词汇表
人工智能完整词典
完全随机缺失 (MCAR)
缺失机制中,观测值缺失的概率既不依赖于已观测数据,也不依赖于缺失数据本身。缺失数据代表完整数据集的一个简单随机子集。
随机缺失 (MAR)
缺失机制中,数据缺失的概率仅依赖于已观测值,而不依赖于缺失值本身。这种模式允许通过基于已观测变量的条件插补进行修正。
非随机缺失 (MNAR)
缺失机制中,数据缺失的概率直接依赖于缺失值本身。在这种情况下,标准的插补方法可能会引入显著的偏差。
Little's MCAR 检验
检验完全随机缺失 (MCAR) 原假设的统计检验。基于完整案例和不完整案例之间的均值和协方差比较。
模式矩阵
指示每个观测值和变量数据存在 (1) 或缺失 (0) 的二进制矩阵。允许可视化识别复杂的缺失数据结构。
缺失数据机制
在数据集中生成缺失数据的底层过程。包括三种主要机制:MCAR、MAR 和 MNAR,每种都需要不同的处理方法。
完整案例分析
仅使用没有任何缺失值的观测值进行分析的方法。实现简单,但如果 MCAR 不成立,可能导致大量数据丢失和偏差。
可用案例分析
为每个统计计算使用所有可用数据的方法,允许不同变量有不同的样本量。包括成对删除和列表删除方法。
单调缺失模式
如果某个观测的变量存在缺失,那么预定义顺序中所有后续变量也都缺失的数据结构。这大大简化了多重插补方法。
缺失相关性
衡量不同变量缺失模式之间关联性的指标。强相关性可能表明MAR缺失机制或暗示数据中存在结构性关系。
缺失数据可视化
用于探索和传达缺失数据的结构与范围的一系列图形技术(热力图、条形图、模式图等)。是初步诊断的重要工具。
响应率分析
按变量、组别或时间系统评估响应率的分析方法。有助于识别与无响应相关的因素并检测潜在偏差。
缺失数据诊断
在插补前全面评估缺失数据特征、模式和机制的过程。结合统计分析和可视化来指导适当的处理方式。
任意缺失模式
缺失数据没有特定组织结构,缺失可能出现在数据集任何位置的数据结构。需要更复杂的插补方法如MICE。
缺失数据概况
描述缺失数据分布、模式和特征的综合报告。包含描述性统计和可视化以便进行整体评估。