朴素贝叶斯算法简介

时间:2022-12-14 14:10:16

应用场景:

已知,现有十位男士的数据如下图所示(1为“是”,0为“否”):

朴素贝叶斯算法简介


现有一位男士的属性为:不高(0),富(1),不帅(0),

问:该男士已婚的概率更大还是未婚的概率更大?

基本原理:贝叶斯公式:

P(A|B) = P(B|A)P(A)/P(B)


解释一下:我们现在要算B(不高,富,不帅)发生的前提下,A(结婚)和A(未婚)哪个的概率更大。

代入公式:

P(已婚|(不高,富,不帅)) = P((不高,富,不帅)|已婚)P(已婚) / P(不高,富,不帅)

P(未婚|(不高,富,不帅)) = P((不高,富,不帅)|未婚)P(未婚) / P(不高,富,不帅)


我们发现,无论是对于已婚还是未婚,等号右边的分母部分都是 P(不高,富,不帅),是可以忽略不算的。

问题就转换成:P((不高,富,不帅)|已婚)P(已婚)  与 P((不高,富,不帅)|未婚)P(未婚) 谁更大的问题。

根据马可夫假设,P((不高,富,不帅)|已婚) 约等于 P(不高|已婚)P(富|已婚)P(不帅|已婚)。


以已婚为例:P(不高|已婚)P(富|已婚)P(不帅|已婚)P(已婚)

                    已婚人数为6人:其中不高的为3人(6号、8号、10号),概率为1/2。

                                              其中富的为3人(1号、3号、8号),概率为1/2。

                                              其中不帅的为2人(3号、8号),概率为1/3。

                    总人数为10人,P(已婚)=3/5    .

                    相乘得出概率为1/20. 


同理,求未婚概率:P(不高|未婚)P(富|未婚)P(不帅|未婚)P(未婚)

                             =      1/2       *        1/4        *     1/2          *     2/5

                             =     1/40

所以,判断此人已婚的概率更大,是未婚概率的一倍。