多重插补存在的问题-hc6800-es v2.0

时间:2024-06-28 13:37:45
【文件属性】:

文件名称:多重插补存在的问题-hc6800-es v2.0

文件大小:180KB

文件格式:PDF

更新时间:2024-06-28 13:37:45

插补数据

五、多重插补存在的问题 多 重 插 补 推 断 假 定 分 析 者 模 型 和 插 补 模 型 是 相 同 的 , 但实际应用操作时 , 两个模型并不完全相同。 例如 , 假设三元数据集 Y1、Y2、Y3、Y1、Y2 是完全观测 数据 , 而 Y3 有缺失值 , 一个插补者创建插补模型 Y3=Y1· Y2, 而分析人员后面则使用模型 Y3=Y1, 在这种案例中 , 分 析者假设 Y3、Y2 是独立的,即无相关关系。 如果假设是真的 , 则插补模型仍然适用 , 尽管有些保 守 , 但是它反映了 Y3 和 Y2 关系的估计的附加不确定性 , 因此源于多重插补的推断也还是有效的。 另一方面 , 假 设 分 析 者 模 型 为 Y3=Y1, 而 Y3 和 Y2 相 关 , 则模型 Y3=Y1 将是有偏的 , 分 析 者 模 型 将 是 不 恰 当 , 适当的结果只能从合适的分析者模型中产生。 此外 , 另外一种情形也会发生 : 即插补者假设多于分 析者。例如 , 插补者建立的多重插补模型为 Y3=Y1, 即插补 者假设是独立的,即无相关关系。但分析者在分析时模拟 的模型为 Y3=Y1·Y2。当假设成立时 , 插补模型为正确的模 型 , 推 断 应 保 留 ; 如 果 假 设 不 成 立 , 即 假 设 Y3,Y2 是 相 关 的 , 则建立在不正确的假定下的插补值将使分析者相关 关系的估计值与 0 有偏。这样 , 建立在不正确模型下的多 重插补值 , 会导致不正确的结论。 因此在实施插补时应包括尽可能多的变量 , 当引入 了不重要的变量时 , 因为不重要的预测值而丧失的精度 , 对获得的多重插补数据集的分析的总的有效性( 总效用) 而言 , 代价是相对较小的。分析者通过对插补者模型的描 述将获得插补中所含变量信息 , 将了解哪几种变量间的 关系可以简单的归于 0, 因此多重插补数据集的插补者模 型的描述是有用的。 综上 , 虽然多重插补在实施时比较复杂 , 难以掌握 , 但是随着计算机技术的迅速发展 , 相应的插补专业软件 的出现以及多重插补本身的优势 , 多重插补将成为处理 缺失数据的主要手段。 参考文献: [1] 谢邦昌著.张尧庭、董麓改编.抽样调查的理论及其 应用方法 [M] 中国统计出版社.1998.3 [2]金勇进 缺失数据的插补调整 [J] 数理统计与管理, 2001.5 [3] 冯士雍、倪加勋、邹国华 抽样调查理论与方法 [M]. 中国统计出版社. 1998 [4]Judith T.Lessler William D.Kalsbeek 著 金勇进译 倪加 勋校 调查中的非抽样误差[M].中国统计出版社. 1997.10 [5]傅德印.*统计数据质量体系研究[M].甘肃人民出 版社.2000 [6] 庞新生.多重插补处理缺失数据方法的理论基础探析 [J] 理论新探 2005. [7]Little, R .J.A. and R ubin, D.B. (1987), Statistical Analy sis with Missing Data, New York: John Wiley & Sons, Inc. [8]Tiandong Li. Comparison of Multiple Imputation and Other Imputation Method Department of Measurement, Applied Statistics and Evaluation University of Mary land, College Park [9] Donald B. R ubin. Multiple Imputation for Nonresponse in Surveys [M].John Wiley, 1987. ( 作者单位: 兰州商学院) 表 1 多重插补推断的相对效率 ! m 10% 20% 30% 50% 70% 3 0.9677 0.9375 0.9091 0.8571 0.8108 5 0.9804 0.9615 0.9434 0.9091 0.8772 10 0.9901 0.9804 0.9709 0.9524 0.9346 20 0.9950 0.9901 0.9852 0.9756 0.9662 7


网友评论