应用场景:
已知,现有十位男士的数据如下图所示(1为“是”,0为“否”):
现有一位男士的属性为:不高(0),富(1),不帅(0),
问:该男士已婚的概率更大还是未婚的概率更大?
基本原理:贝叶斯公式:
P(A|B) = P(B|A)P(A)/P(B)
解释一下:我们现在要算B(不高,富,不帅)发生的前提下,A(结婚)和A(未婚)哪个的概率更大。
代入公式:
P(已婚|(不高,富,不帅)) = P((不高,富,不帅)|已婚)P(已婚) / P(不高,富,不帅)
P(未婚|(不高,富,不帅)) = P((不高,富,不帅)|未婚)P(未婚) / P(不高,富,不帅)
我们发现,无论是对于已婚还是未婚,等号右边的分母部分都是 P(不高,富,不帅),是可以忽略不算的。
问题就转换成:P((不高,富,不帅)|已婚)P(已婚) 与 P((不高,富,不帅)|未婚)P(未婚) 谁更大的问题。
根据马可夫假设,P((不高,富,不帅)|已婚) 约等于 P(不高|已婚)P(富|已婚)P(不帅|已婚)。
以已婚为例:P(不高|已婚)P(富|已婚)P(不帅|已婚)P(已婚)
已婚人数为6人:其中不高的为3人(6号、8号、10号),概率为1/2。
其中富的为3人(1号、3号、8号),概率为1/2。
其中不帅的为2人(3号、8号),概率为1/3。
总人数为10人,P(已婚)=3/5 .
相乘得出概率为1/20.
同理,求未婚概率:P(不高|未婚)P(富|未婚)P(不帅|未婚)P(未婚)
= 1/2 * 1/4 * 1/2 * 2/5
= 1/40
所以,判断此人已婚的概率更大,是未婚概率的一倍。