多元高斯分布的协方差矩阵与信息矩阵

时间:2024-06-01 10:22:07

零均值的多元高斯分布有如下概率形式:

多元高斯分布的协方差矩阵与信息矩阵

其中多元高斯分布的协方差矩阵与信息矩阵协方差矩阵,协方差矩阵的逆可以记作多元高斯分布的协方差矩阵与信息矩阵,也叫信息矩阵。当变量xx是三维变量时,协方差矩阵为:

多元高斯分布的协方差矩阵与信息矩阵

其中多元高斯分布的协方差矩阵与信息矩阵

其实在应用中,往往我们直接操作的是信息矩阵,而不是协方差矩阵。下面从一个例子来体会一下协方差矩阵与信息矩阵。

example

假设多元高斯分布的协方差矩阵与信息矩阵室外的温度,多元高斯分布的协方差矩阵与信息矩阵分别是房间1房间3室内温度:

多元高斯分布的协方差矩阵与信息矩阵

其中,多元高斯分布的协方差矩阵与信息矩阵为相互独立,且各自服从协方差为多元高斯分布的协方差矩阵与信息矩阵的高斯分布。根据上面它们之间的联系,我们可以求出多元高斯分布的协方差矩阵与信息矩阵协方差矩阵,首先:

多元高斯分布的协方差矩阵与信息矩阵

然后同理,可以求出另外两个对角元素为多元高斯分布的协方差矩阵与信息矩阵。而对于协方差矩阵的非对角元素有:

多元高斯分布的协方差矩阵与信息矩阵

依次类似,可以得到完整的协方差矩阵为:

多元高斯分布的协方差矩阵与信息矩阵

信息矩阵协方差矩阵的逆矩阵,此处我们可以通过计算联合高斯分布来得到协方差矩阵的逆:

多元高斯分布的协方差矩阵与信息矩阵

利用指数性质,可以计算出联合概率分布如下:

多元高斯分布的协方差矩阵与信息矩阵

所以,这里上面矩阵就是协方差矩阵的逆,也就是信息矩阵:

多元高斯分布的协方差矩阵与信息矩阵

由上,可以看到当在协方差矩阵中,多元高斯分布的协方差矩阵与信息矩阵之间是相关的,而在信息矩阵中,它们是相互独立的(相关系数为0),这是因为,我们在推导信息矩阵时是使用了联合分布的链式法则,信息矩阵中多元高斯分布的协方差矩阵与信息矩阵的相关性在多元高斯分布的协方差矩阵与信息矩阵确定之后计算的,此时它们是相互独立的。

上述例子中去掉x3

协方差矩阵直接只计算前两个相关的协方差矩阵即可,也就是去掉划线的部分

多元高斯分布的协方差矩阵与信息矩阵

变为:

多元高斯分布的协方差矩阵与信息矩阵

至于信息矩阵,只需要把信息矩阵公式中多元高斯分布的协方差矩阵与信息矩阵相关的部分(蓝色)去掉:

 

多元高斯分布的协方差矩阵与信息矩阵

得到:

多元高斯分布的协方差矩阵与信息矩阵

之所以要移除一个变量,然后再算它的信息矩阵,是因为在实际应用中经常会用到这样的操作,上面只讲了原理,下面会抽时间讲讲如何快速实现,会需要舒尔补(Schur’s complement)边缘化(marginalization)

补充

此处需要注意,协方差矩阵与信息矩阵都可以用来表示多元变量之间的相关性。但是,协方差矩阵是衡量的变量之间边界概率关系,通常是直接相关性,信息矩阵会有间接相关性,衡量的是变量之间的条件概率关系。因此,在计算中我们会发现有些协方差矩阵中相关的两个量在信息矩阵中不相关,有些协方差矩阵中不相关的两个量在信息矩阵中相关

比如在下面这个例子中

多元高斯分布的协方差矩阵与信息矩阵

多元高斯分布的协方差矩阵与信息矩阵

协方差矩阵为:

多元高斯分布的协方差矩阵与信息矩阵

信息矩阵为:

多元高斯分布的协方差矩阵与信息矩阵

多元高斯分布的协方差矩阵与信息矩阵协方差矩阵不相关,在信息矩阵相关。这是因为协方差矩阵中是直接相关性,信息矩阵可以使用链式法则推导,其中当多元高斯分布的协方差矩阵与信息矩阵固定后,这两个变量就会变成相关的了。