贝叶斯公式
对贝叶斯公式的理解和推导,对先验后验概率的解释
贝叶斯公式
参考:YouTobe
一、案例引入
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B)=\frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A)
P ( A ∩ B ) = P ( A ∣ B ) × P ( B ) = P ( B ∣ A ) × P ( A ) P(A\cap B)=P(A|B)\times P(B)=P(B|A)\times P(A) P(A∩B)=P(A∣B)×P(B)=P(B∣A)×P(A)
下图给出抛骰子的例子,解释如何推出贝叶斯公式
二、贝叶斯通式
P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ) E = E v i d e n c e , H = H y p o t h e s i s P(H|E)=\frac{P(E|H)P(H)}{P(E)}\ \ \ E=Evidence\ ,\ H=Hypothesis P(H∣E)=P(E)P(E∣H)P(H) E=Evidence , H=Hypothesis
贝叶斯定理关注的是:在已知的证据下,假设成立的概率有多大
三、公式推理
以上图为参考进行下述公式推理:
H ˉ : n o t H P ( H ˉ ) = 1 − P ( H ) \bar H:not\ H\ \ \ \ \ \ \ \ P(\bar H)=1-P(H) Hˉ:not H P(Hˉ)=1−P(H)
P ( E ) = P ( E ∩ H ) + P ( E ∩ H ˉ ) = P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(E)=P(E\cap H)+P(E\cap \bar H)=P(E|H)P(H)+P(E|\bar H)P(\bar H) P(E)=P(E∩H)+P(E∩Hˉ)=P(E∣H)P(H)+P(E∣Hˉ)P(Hˉ)
P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(H|E)=\frac{P(E|H)P(H)}{P(E|H)P(H)+P(E|\bar H)P(\bar H)} P(H∣E)=P(E∣H)P(H)+P(E∣Hˉ)P(Hˉ)P(E∣H)P(H)
可以看到贝叶斯公式中分母为证据 E E E 的概率,但是我们有时并不知道证据 E E E 的概率,需要通过条件概率来计算 P ( E ) P(E) P(E)
四、举例理解
案例一
小明是一个内敛的人,他总是乐于助人,有一个温顺整洁的灵魂,他总是对自己有所要求,并规矩的生活,对细节非常在意。请问小明更可能是农民还是图书管理员?
Fact:图书管理员与农民的比例是1:50
样本空间 | 符合条件 | 概率 | |
---|---|---|---|
图书管理员 | 10 | 5 | 9% |
农民 | 500 | 50 | 91% |
接下来用贝叶斯公式进行推导:
E : s t a t e m e n t b y p e o p l e E:statement\ \ by\ \ people E:statement by people
P ( H ) : P ( l i b r a r i a n ) = 1 1 + 50 = 0.0196 P(H):P(librarian)=\frac{1}{1+50}=0.0196 P(H):P(librarian)=1+501=0.0196
P ( H ˉ ) : P ( f a r m e r ) = 50 1 + 50 = 0.9804 P(\bar H):P(farmer)=\frac{50}{1+50}=0.9804 P(Hˉ):P(farmer)=1+5050=0.9804
假设: P ( E ∣ H ) = 0.5 P ( E ∣ H ˉ ) = 0.1 P(E|H)=0.5\ \ \ \ \ P(E|\bar H)=0.1 P(E∣H)=0.5 P(E∣Hˉ)=0.1
P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(H|E)=\frac{P(E|H)P(H)}{P(E|H)P(H)+P(E|\bar H)P(\bar H)} P(H∣E)=P(E∣H)P(H)+P(E∣Hˉ)P(Hˉ)P(E∣H)P(H)
P ( H ∣ E ) = 0.5 × 0.0196 0.5 × 0.0196 + 0.1 × 0.9804 = 0.0909 P(H|E)=\frac{0.5\times0.0196}{0.5\times0.0196+0.1\times0.9804}=0.0909 P(H∣E)=0.5×0.0196+0.1×0.98040.5×0.0196=0.0909
所以得出:在证据 E E E 成立(人们对小明的描述)的情况下, H H H 事件(假设小明为图书管理员)发生的概率为 9.09%
案例二
你被检验出可能有一种罕见疾病
- 在人群中只有0.1%的人会得病
这个测试非常准确
- 如果有这个疾病,检查准确率达到99%
- 如果没有这个疾病,会有2%的误诊为患者
1000人的样本空间 | 阳性 | 概率 | |
---|---|---|---|
疾病 | 1 | 1 | 1 20 + 1 \frac{1}{20+1} 20+11 |
健康 | 999 | 20 | 20 20 + 1 \frac{20}{20+1} 20+120 |
带入贝叶斯公式
E E E : 你被检验出有罕见病
P ( H ) : 患病概率 = 0.001 P(H):患病概率=0.001 P(H):患病概率=0.001 (先验概率)
P ( H ˉ ) = 0.999 P(\bar H)=0.999 P(Hˉ)=0.999
P ( E ∣ H ) : s e n s i t i v i t y = 0.99 P(E|H):sensitivity=0.99 P(E∣H):sensitivity=0.99(真阳)
P ( E ∣ H ˉ ) : f a l s e p o s i t i v e r a t e = 0.02 P(E|\bar H):false\ positive\ rate=0.02 P(E∣Hˉ):false positive rate=0.02(假阳)
P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(H|E)=\frac{P(E|H)P(H)}{P(E|H)P(H)+P(E|\bar H)P(\bar H)} P(H∣E)=P(E∣H)P(H)+P(E∣Hˉ)P(Hˉ)P(E∣H)P(H)
P ( H ∣ E ) = 0.99 × 0.001 0.99 × 0.001 + 0.02 × 0.999 = 0.0472 P(H|E)=\frac{0.99\times0.001}{0.99\times0.001+0.02\times0.999}=0.0472 P(H∣E)=0.99×0.001+0.02×0.9990.99×0.001=0.0472(后验概率)
通过贝叶斯计算,你被检验出患有罕见病时,你真正患病的概率只有4.72%
如果再次检测还是为阳性
此时的相关证据与假设概率如下
P ( H ) = 0.0472 P(H)=0.0472 P(H)=0.0472(后验概率:在第一次测得阳性的概率)
P ( H ˉ ) = 0.9528 P(\bar H)=0.9528 P(Hˉ)=0.9528
P ( E ∣ H ) : s e n s i t i v i t y = 0.99 P(E|H):sensitivity=0.99 P(E∣H):sensitivity=0.99(真阳)
P ( E ∣ H ˉ ) : f a l s e p o s i t i v e r a t e = 0.02 P(E|\bar H):false\ positive\ rate=0.02 P(E∣Hˉ):false positive rate=0.02(假阳)
除了假设患病概率以外,其他的不变
P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(H|E)=\frac{P(E|H)P(H)}{P(E|H)P(H)+P(E|\bar H)P(\bar H)} P(H∣E)=P(E∣H)P(H)+P(E∣Hˉ)P(Hˉ)P(E∣H)P(H)
P ( H ∣ E ) = 0.99 × 0.0472 0.99 × 0.0472 + 0.02 × 0.9528 = 0.7103 P(H|E)=\frac{0.99\times0.0472}{0.99\times0.0472+0.02\times0.9528}=0.7103 P(H∣E)=0.99×0.0472+0.02×0.95280.99×0.0472=0.7103
可以看到,如果两次检测都为阳性,你患病的概率会一下子达到71.03%,与之前的4.72%形成了非常强的对比
上述的迭代运算也是贝叶斯的核心精神:通过不断的实验累积证据,从而更精准的判断一个假设是否正确
五、先验概率与后验概率
参考上述例子分析
先验概率是你提前已经知晓的概率(假设的实际概率)
而后验概率是在证据成立的前提下,确定假设成立的概率
通常情况下,后验概率我们是不得而知,需要通过贝叶斯公式来求得后验概率。所以贝叶斯也是一个求后验概率的公式
而更精准的判断一个假设是否正确
五、先验概率与后验概率
参考上述例子分析
先验概率是你提前已经知晓的概率(假设的实际概率)
而后验概率是在证据成立的前提下,确定假设成立的概率
通常情况下,后验概率我们是不得而知,需要通过贝叶斯公式来求得后验概率。所以贝叶斯也是一个求后验概率的公式
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)