朴素贝叶斯分类

时间:2021-11-08 12:26:09

朴素贝叶斯Naive Bayes

其原理是根据最大后验概率来对数据进行分类

也就是把数据分类到使得后验概率最大的那一类

有点像极大似然估计

公式

贝叶斯公式:
P(B|A)=P(A|B)P(B)P(A)

具体到贝叶斯分类的应用就是:

P(|)=P(|)P()P()

最后我们求出使得上式最大的那个类别,就是贝叶斯分类结果

例子1

朴素贝叶斯分类

如上图,天气、温度、湿度、风力决定了是否打球

有14个样本

现在的天气是:
outlook=sunny
temperature=mild
humidity=normal
wind=weak
那么请用贝叶斯方法来决定是否去打球

P(|sunny,mild,normal,weak)=P(sunny,mild,normal,weak|)P()P(sunny,mild,normal,weak)          (1)

在这里我们假设天气、湿度、温度、风向在打球或者不打球的条件下互相条件独立、互不影响,这里正是朴素贝叶斯的朴素之处

要注意:这里是条件独立

则: P(sunny,mild,normal,weak|)=P(sunny|)P(mild|)P(normal|)P(weak|)=29496969=32279

P()=914

同理有:
P(|sunny,mild,normal,weak)=P(sunny,mild,normal,weak|)P()P(sunny,mild,normal,weak)          (2)

其中,

P(sunny,mild,normal,weak|)=P(sunny|)P(mild|)P(normal|)P(weak|)=35251525=12625

P()=514

观察(1)(2)可知,要比较两者大小,只需比较两者分子大小

由前面的计算可知:
(1)式的分子等于: 32279×914=0.07373

(2)式的分子等于: 12625×514=0.00685

明显(1)式大于(2)式

因此朴素贝叶斯估计结果为去打球