PCA (Principal Component Analysis)主成分分析公式推导

时间:2021-11-18 13:50:39

PCA (Principal Component Analysis) 公式推导

p k , X p D , Y k = f ( X ) , f p 维向量 X 降维到 k 维向量 Y
X ^ = g ( Y ) = D Y , D p × k = ( d 1 , , d k ) , 其中 D 是样本集合。

目标函数

a r g m i n f , g X D X g ( f ( X ) ) 2 2
s.t.  d j 2 = 1 d i , d j 互相正交, 1 i , j k

公式推导


  1. d j 2 = 1 d i , d j 互相正交, 1 i , j k D D = I k × k
    X D , φ ( D , Y ; X ) = X g ( Y ) 2 2 = X D Y 2 2
    = ( X D Y ) ( X D Y )
    d φ ( D , Y ; X ) = 2 ( X D Y ) d ( X D Y )
    = 2 ( X D Y ) ( d D Y + D d Y )
    = 2 ( X Y D ) ( d D Y + D d Y )
    = 2 ( X Y D ) d D Y 2 ( X Y D ) D d Y
    = 2 ( X Y D ) d D Y 2 ( X D Y D D ) d Y
    = 2 ( X Y D ) d D Y 2 ( X D Y ) d Y
    φ Y = 2 ( X D Y )
    f ( X ) = Y = a r g m i n Y φ = D X

  2. φ ( D , Y ; X ) = X g ( Y ) 2 2 = X D Y 2 2
    = X D D X 2 2
    = ( I p × p D D ) X 2 2
    X D φ ( D , Y ; X ) = X D ( I p × p D D ) X 2 2
    = X D [ ( I p × p D D ) X ] ( I p × p D D ) X
    = X D X ( I p × p D D ) ( I p × p D D ) X
    = X D X ( I p × p 2 D D + D D D D ) X
    = X D X ( I p × p D D ) X
    X = ( X 1 , , X | D | ) , 其中 | D | 是样本集合 D 的大小。则
    X D φ ( D , Y ; X ) = t r [ X ( I p × p D D ) X ]
    = t r [ X X ( I p × p D D ) ]
    = t r [ X X ( I p × p D D ) ]
    = t r ( X X X X D D )
    = t r ( X X ) t r ( X X D D )
    = t r ( X X ) t r ( D X X D )
    因此
    (1) m i n f , g X D X g ( f ( X ) ) 2 2 = constant + m a x D   t r ( D X X D )  s.t.  D D = I
    由于 X X 是是半正定实矩阵,因此存在 Λ = ( λ 1 , λ p ) , 存在正交矩阵 P , 使得 X X = P Λ P ,
    λ j 0 , λ i λ j , i j , 1 i , j p ,
    于是 D X X D = D P Λ P D = ( P D ) Λ ( P D )
    Q = ( q 1 q k ) = P D ,
    Q Q = D P P D = I
    于是 t r ( D X X D ) = t r ( Q Λ Q )
    = j = 1 k i = 1 p λ i q i j 2
    = i = 1 p λ i ( j = 1 k q i j 2 )
    i = 1 k λ i
    小于等于是因为:
    1) i = 1 p j = 1 k q i j 2 = k
    2) 由于 Q 的列向量可扩展成一组标准正交基,因此 j = 1 k q i j 2 1
    P D = Q = ( I k × k 0 ) 时等号成立。
    此时 D X X D = D P Λ P D = Q Λ Q = ( λ 1 , λ k ) ,
    X X d j = λ j d j , 1 j k ,
    因此 d j X X 的属于特征值 λ j 的特征向量。

性质

Y = ( Y 1 , , Y k ) = X D , X = ( X 1 , , X | D | ) ,
max D Var Y = max D tr ( Y Y ) = max D tr ( D X X D ) s.t. D D = I
这就是公式推导 1 中的式子 (1)
此时称 Y j Y 的第 j 个主成分 (Principal Component) 。
k : Number of Principal Components.
Y j 的方差为 λ j , Y i , Y j 正交, 1 i j k

证明

Y i Y j = ( X d j ) X d j = d i X X d j = λ j d i d j = { λ j , i = j , 0 , otherwise , 1 i , j k ,

推论

Percentage of total variation retained = Var Y Var X = i = 1 k λ i i = 1 p λ i