DA算法-2020美赛a题解题方法

时间:2024-06-29 04:50:43
【文件属性】:

文件名称:DA算法-2020美赛a题解题方法

文件大小:1.38MB

文件格式:PDF

更新时间:2024-06-29 04:50:43

多重插补

2.1 MCMC方法 MCMC是贝叶斯推断中一种探索后验分布的方法,下 面通过正态模型说明MCMC基本思想和实施步骤,令 Y= ( )y1,y2,⋯,yn T 为完全数据集,假定 y1 ,y2 ,…,yn |θ ~ iid Np( )μ,∑ ,其中 θ= ( )μ,∑ 未知,运用该方法对该 缺失数据集插补可以分为两步: 2.1.1 插补步骤 根据给定的均数向量 μ 和协方差矩阵 ∑,从条件分 布 p(Xmis|Xobs,φ) 中 为 缺 失 值 抽 取 插 补 值 。 假 设 μ= [ ]μ1,μ2 是两部分变量的均数向量,μ1 是 Xobs 的均值向 量,μ2 是 Xmis 的均值向量,同时设定: ∑= | | | | | | ∑11 ∑12 ∑12 ∑22 (9) 其中 ∑11 是 Xobs 的协方差矩阵,∑22 是 Xmis 的协方 差矩阵,∑12 是 Xobs 与 Xmis 之间的协方差矩阵。在多元 正态分布的假设下,当给定 Xobs = x1时,Xmis 的均数为: μ21 = μ2 +∑ ′ ∑11 -1(x1 - μ) (10) 其对应的条件协方差矩阵为: ∑221=∑22−∑′ ∑11 -1 ∑12 (11) 2.1.2 后验步骤 在每一次循环运算中,用上一次插补步中得到的 μ 和 协方差矩阵对参数 φ 进行模拟。循环进行这两步过程,产 生一个足够长的马尔科夫链: (X (1)mis,φ (1)),(X (2)mis,φ (2)),k (12) 当该链会聚在一个稳定的分布 p(Xmis,φ|Xobs)时,就可 以近似独立地从该分布中为缺失值抽取插补值。 为了建立插补程序,我们必须做某些假定:首先要求 对缺失机制必须做出假定,如随机缺失(MAR),如同可忽 略的假定,令Yobs 为观测值,Ymis 为缺失值,R 为回答指 示变量,R 的分布依赖于 Yobs 而不依赖于 Ymis ,即有 P( )R|Yobs,Ymis =P( )R|Yobs ;其次要求对参数的先验分布 必须做出假定,多重插补必须反映插补模型参数的不确定性: P( )Ymis|Yobs = ∫P( )Ymis|Yobs,θ P( )θ|Yobs dθ (13) 其中有:P( )θ|Yobs ∝L( )θ|Yobs π( )θ ,对于先验分布 π( )θ 要求,推断对于 π的选择不敏感。 2.2 DA算法 方 法 应 用 89


网友评论