协方差矩阵计算

时间:2022-05-31 00:36:04

cov(x,y)=EXY-EX*EY
 
  协方差的定义,EX为随机变量X的 数学期望,同理,EXY是XY的 数学期望
 
  举例:
 
  Xi 1.1 1.9 3
 
  Yi 5.0 10.4 14.6
 
  E(X) = (1.1+1.9+3)/3=2
 
  E(Y) = (5.0+10.4+14.6)/3=10
 
  E(XY)=(1.1×5.0+1.9×10.4+3×14.6)/3=23.02
 
  Cov(X,Y)=E(XY)-E(X)E(Y)=23.02-2×10=3.02
 
  此外:还可以计算:D(X)=E(X^2)-E^2(X)=(1.1^2+1.9^2+3^2)/3 - 4=4.60-4=0.606 σx=0.778888
 
  D(Y)=E(Y^2)-E^2(Y)=(5^2+10.4^2+14.6^2)/3-100=15.44 σy=3.93
 
  X,Y的相关系数:
 
  r(X,Y)=Cov(X,Y)/(σxσy)=3.02/(0.778888×3.93) = 0.986
 
  表明这组数据X,Y之间相关性很好!
 
 
补充:计算协方差矩阵
        如计算矩阵    1     2     3
                10    20    30  的协方差矩阵。
计算结果为:
        40.5000   81.0000   121.5000
        81.0000   162.0000  243.0000
        121.5000  243.0000  364.5000
 

协方差  ????https://www.cnblogs.com/terencezhou/p/6235974.html

通常,在提到协方差的时候,需要对其进一步区分。(1)随机变量的协方差。跟数学期望、方差一样,是分布的一个总体参数。(2)样本的协方差。是样本集的一个统计量,可作为联合分布总体参数的一个估计。在实际中计算的通常是样本的协方差。

随机变量的协方差

在概率论和统计中,协方差是对两个随机变量联合分布线性相关程度的一种度量。两个随机变量越线性相关,协方差越大,完全线性无关,协方差为零。定义如下。
 
cov(X,Y)=E[(X−E[X])(Y−E[Y])]
当X,Y是同一个随机变量时,X与其自身的协方差就是X的方差,可以说方差是协方差的一个特例。
 
cov(X,X)=E[(X−E[X])(X−E[X])]
 
var(X)=cov(X,X)=E[(X−E[X])2]
由于随机变量的取值范围不同,两个协方差不具备可比性。如X,Y,Z分别是三个随机变量,想要比较X与Y的线性相关程度强,还是X与Z的线性相关程度强,通过cov(X,Y)与cov(X,Z)无法直接比较。定义相关系数η为
 
协方差矩阵计算
通过X的方差var(X)与Y的方差var(Y)对协方差cov(X,Y)归一化,得到相关系数η,η的取值范围是[−1,1]。1表示完全线性相关,−1表示完全线性负相关,0表示线性无关。线性无关并不代表完全无关,更不代表相互独立。

样本的协方差

在实际中,通常我们手头会有一些样本,样本有多个属性,每个样本可以看成一个多维随机变量的样本点,我们需要分析两个维度之间的线性关系。协方差及相关系数是度量随机变量间线性关系的参数,由于不知道具体的分布,只能通过样本来进行估计。
设样本对应的多维随机变量为X=[X1,X2,X3,...,Xn]TX=[X1,X2,X3,...,Xn]T,样本集合为{x⋅j=[x1j,x2j,...,xnj]T|1⩽j⩽m},m为样本数量。与样本方差的计算相似,a和b两个维度样本的协方差公式为,其中1⩽a⩽n,1⩽b⩽n,n为样本维度
 
协方差矩阵计算
这里分母为m−1m−1是因为随机变量的数学期望未知,以样本均值代替,*度减一。