多重插补的提出-hc6800-es v2.0

时间:2024-06-28 13:37:44
【文件属性】:

文件名称:多重插补的提出-hc6800-es v2.0

文件大小:180KB

文件格式:PDF

更新时间:2024-06-28 13:37:44

插补数据

二、多重插补的提出 迄今为止 , 学术界已提出并发展了 30 多种插补方 法。在抽样调查中应用的主要是单一插补和多重插补。 单一插补指对每个缺失值 , 从其预测分布中抽取一 个值填充缺失值后 , 使用标准的完全数据分析进 行 处 理。单一插补方法大致可以归为两类 : 随机插补和确定 性插补 , 具体包括 : 均值插补、热卡插补、冷卡插补、回归 插补和模型插补等。但是单一插补假定好像缺失值在完 全数据分析中是已知的 , 并未反映出位置缺失数据的预 测的不确定性 , 容易扭曲变量关系 , 无法反映无回答模 型的不确定性 , 并且参数估计的估计方差结果将是有偏 的。 多重插补法则弥补了单一插补的缺陷 , 考虑了缺失 数据的不确定性 , 提出了处理缺失数据的另一种有用的 策略。美国哈佛大学统计学系的 Rubin 教授 70 年代末 首先提出多重插补的思想。它是给每个缺失值都构造 m 个插补值(m>1),这样就产生出 m 个完全数据集 , 对每个 完全数据集分别使用相同的方法进行处理 , 得到个处理 结果 , 再综合这个处理结果 , 最终得到对目标变量的估 计。 与单一插补相比 , 多重插补构造 m 个插补值的目的 是模拟一定条件下的估计量分布 , 应用完全数据分析方 法和融合数据收集者知识的能力 , 根据数据模式采用不 同的模型随机抽取进行插补 , 能够反映在该模型下由缺 失值导致的附加 ( 额外 ) 变异 , 增加了估计的有效性 ; 同 时在多个模型下通过随机抽取进行插补 , 简单地应用完 全数据方法 , 可以对无回答的不同模型下推断的敏感性 进行直接研究。 1987 年 , Rubin 提出了多重插补程序 , 它是用一系 列可能的数据集来填充每一个缺失数据值( 这样也突出 了所需插补值的不确定性) ; 然后使用完全数据的标准 程序去分析这些多重插补数据集 ; 最后对这些分析结果 归纳、综合。需要注意的是无论使用哪一种完全数据分 缺失数据的多重插补方法 文/ 乔丽华 傅德印 4


网友评论