朴素贝叶斯网络

时间:2022-12-14 14:24:35

1.简介

     贝叶斯网络为一个有向无环图,每个顶点表示一个取值,顶点和顶点之间有弧存在,如果有一条弧从x到y,则表示x是y的双亲或直接前驱。一旦给定一个元素的所有双亲,每个变量独立于图中该结点的非后继,这里的独立是条件独立的。

一个简单的贝叶斯网络如图所示。

朴素贝叶斯网络

 

2. 贝叶斯网络的作用

  1)因果推理,已知一定的原因,使用贝叶斯网络的推理计算,求出在该原因下结果发生的概率。

  2)诊断推理,在已知的结果时,找出产生该结果的原因,一直发生了某些结果,根据贝叶斯网络的推理计算,得到造成该结果发生的原因和发生的概率。

  3)支持推理,对原因之间的相互影响进行分析,提供解释以支持所发生的现象。

3.朴素贝叶斯网络

   朴素贝叶斯网络上有约束贝叶斯网络。朴素贝叶斯网络分类器的流程如下:

(1)       对每个样本数据描述为n维特征向量X={ x1, x2, …, xn},每个分量对应一个属性的取值。

(2)       假定有m个类c1c2,…,cm,给定一个未知的数据样本x,分类法将预测出x属于最有最高后验概率(条件x下)的类。也就是说,如果将x分给某个类,则x属于该类的概率一定大于其他类。

P(Ci| x) > P( Cj|x), 1<=j<=m, j<>i

P(Ci | x) = (P( x| Ci) P(Ci))|P( x)

(3)       由于P(x)对于所有类为常数,只需算分子最大即可。如果类的先验概率未知,则通常假设这些类是等概率的。类的先验概率可以通过P(Ci)= si/s,其中si是类Ci中的训练样本数,而s是总的样本数。