通过一个具体实例来快速理解贝叶斯定理

简介

贝叶斯定理是概述中很基本也是最常用的一个定理,也是自然语言处理中一个最基本的公式。它的公式并不复杂,但是理解起来还是有点困难。网上有很多文章介绍如何它是什么或如何使用,但是很少有文章通过具体的实例来说明。因此,为了便于大家理解,本文特使用一个带有数字的具体示例进行演示。希望通过本文能够让更多的初学者快速掌握这条定理的内涵。

贝叶斯定理

首先,让我们认识一下贝叶斯定理:给定事件集合 A = { A i , A 2 , . . . , A n } \mathbb{A} = \{A_i, A_2,...,A_n\} ,满足 0 A i 1 0 \leq A_i \leq 1 P ( A i A j ) = 0 ( i j ) P(A_i \cap A_j) = 0(i\neq j) ,且 i = 1 n A i = 1 \sum_{i=1}^n A_i = 1 ,那么贝叶斯定理可以表示为:
P ( A i B ) = P ( B A i ) P ( A i ) j = 1 n P ( B A j ) P ( A j ) P(A_i | B) = \frac{P(B|A_i) P(A_i)}{\sum_{j=1}^n P(B | A_j) P (A_j)}

实例说明

有四个名子集合 N = { R o s e , J a c k , N a n c y , J o h n } \mathbb{N}=\{Rose, Jack, Nancy, John\} ,现在随机抽取一个名子,则会有对应有4个基本事件: A 1 = { R o s e } , A 2 = { J a c k } , A 3 = { N a n c y } , A 4 = { J o h n } A_1=\{Rose\}, A_2=\{Jack\}, A_3=\{Nancy\}, A_4=\{John\} 。为了简化说明,设每个名子在抽取时选中的几率一样,即 P ( A 1 ) = P ( A 2 ) = P ( A 3 ) = P ( A 4 ) = 25 % P(A_1) = P(A_2) = P(A_3) = P(A_4) = 25\% 。再设另一件 B = { n a m e i n a m e i o } B = \{name_i| name_i 包括字母o\} 。求 P ( A i B ) P(A_i|B) 的概率。

根据贝叶斯定理的公式,欲求 P ( A i ) B ) P(A_i) | B) ,我们可以通过计算 4: P ( B A i ) P ( A i ) P(B | A_i) P(A_i) P ( B A i ) P(B | A_i) 获得。为此,我们列了以下表,列代表需要计算的内容,行代表第 i i 个事件对应的数据。

1: A i A_i 2: P ( B P(B | A i ) A_i) 3: P ( A i ) P(A_i) 4: P ( B P(B | A i ) A_i) P ( A i ) P(A_i) 5: P ( B P(B | A i ) A_i)
A 1 A_1 100% 25% 25% 50%
A 2 A_2 0% 25% 0% 0%
A 3 A_3 0% 25% 0% 0%
A 4 A_4 100% 25% 25% 50%

如上表所示,现在对每列的情况进行说明。

第1列对应事件 A i A_i

第2列表示当事件发生时,事件 B B 的发生概率。比如,当 A 1 A_1 发生时,即名子为 Rose 时,事件 B B 发生的概率是100%,因为 Rose 中一定包括字母o。所以,对于 A 1 A_1 A 4 A_4 的均为100%,而为 A 2 A_2 A 3 A_3 的概率为0%。

第3列计算每个事件 A A 发生的概率,由于是相同概率,所以都是25%。

第4列是第2列和第3列的乘积,也是公式中右侧表达式的分子。

第5列是所要求的最终结果,现在分子已经有了,再计算分母即可,根据现有的数据,我们可以简单代入即可求得右侧表达式分母的值,即: j = 1 n P ( B A j ) P ( A j ) = 25 % + 0 % + 0 % + 25 % = 50 % \sum_{j=1}^{n} P(B|A_j)P(A_j)= 25\%+0\%+0\%+25\% = 50\%

所以,将第4列的值,除以 50%,即可求得 P ( B A i ) P(B|A_i) 的值。

注意: P ( B A ) P(B|A) 是一个条件概率,即在 A A 发生时, B B 发生的概率。而 P ( A B ) P(A_B) 表示的是 A A B B 同时发生的概率。虽然两者中A都已经发生,但是本质区别在于B是否发生:在条件概率中B可能发生,可能不发生;而在后面B一定发生。举例来说,A表示下雨,B表示在家。比如小张下雨天在家的几率是50%,即P(B|A)=50%,但是P(AB)可能只有10%,因为下雨也是有概率的,还有不下雨的情况,比如下雨的几率为20%,非雨天的几率为80%。那么根据公式 P ( A B ) = P ( A B ) P ( A ) P(AB) = P(A|B) P(A) ,即下雨又在家的几率为 50% * 20% = 10%。

小结

根据以上计算结果,我们可以看出贝叶斯定理就是在 P ( A i ) P(A_i) P ( B ) P(B) P ( B A i ) P(B|A_i) 已知的情况下,求 P ( A i B P(A_i|B 。以本示例来说,就是在已经所有抽样名称,是不是包括字母o 和 抽样发生是不是B,然后再求出是某字母的情况下求Ai求B的概率。

所以,当我们知道了某事件 A \mathbb{A} 以后,可以进一步求得在事件 A i A_i 发生时,P(B) 也发生的概率,然后以此反推,求出在不同 A i A_i 的情况下求出 B B 发生的概率。实际上就是在已经A条件下发生B的概率,再反过来在B的条件下发生A的概率,是一个通过先验求出后验结果的过程。

发布了326 篇原创文章 · 获赞 94 · 访问量 19万+

猜你喜欢

转载自blog.csdn.net/weixin_43145361/article/details/103955061