贝叶斯公式

参考:YouTobe

一、案例引入

P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B)=\frac{P(B|A)P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)

P ( A ∩ B ) = P ( A ∣ B ) × P ( B ) = P ( B ∣ A ) × P ( A ) P(A\cap B)=P(A|B)\times P(B)=P(B|A)\times P(A) P(AB)=P(AB)×P(B)=P(BA)×P(A)

下图给出抛骰子的例子,解释如何推出贝叶斯公式

在这里插入图片描述

在这里插入图片描述

二、贝叶斯通式

P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E )     E = E v i d e n c e   ,   H = H y p o t h e s i s P(H|E)=\frac{P(E|H)P(H)}{P(E)}\ \ \ E=Evidence\ ,\ H=Hypothesis P(HE)=P(E)P(EH)P(H)   E=Evidence , H=Hypothesis

贝叶斯定理关注的是:在已知的证据下,假设成立的概率有多大

三、公式推理

在这里插入图片描述

以上图为参考进行下述公式推理:

H ˉ : n o t   H          P ( H ˉ ) = 1 − P ( H ) \bar H:not\ H\ \ \ \ \ \ \ \ P(\bar H)=1-P(H) Hˉ:not H        P(Hˉ)=1P(H)

P ( E ) = P ( E ∩ H ) + P ( E ∩ H ˉ ) = P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(E)=P(E\cap H)+P(E\cap \bar H)=P(E|H)P(H)+P(E|\bar H)P(\bar H) P(E)=P(EH)+P(EHˉ)=P(EH)P(H)+P(EHˉ)P(Hˉ)

P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(H|E)=\frac{P(E|H)P(H)}{P(E|H)P(H)+P(E|\bar H)P(\bar H)} P(HE)=P(EH)P(H)+P(EHˉ)P(Hˉ)P(EH)P(H)

可以看到贝叶斯公式中分母为证据 E E E 的概率,但是我们有时并不知道证据 E E E 的概率,需要通过条件概率来计算 P ( E ) P(E) P(E)

四、举例理解

案例一

小明是一个内敛的人,他总是乐于助人,有一个温顺整洁的灵魂,他总是对自己有所要求,并规矩的生活,对细节非常在意。请问小明更可能是农民还是图书管理员?

Fact:图书管理员与农民的比例是1:50

样本空间符合条件概率
图书管理员1059%
农民5005091%

接下来用贝叶斯公式进行推导:

E : s t a t e m e n t    b y    p e o p l e E:statement\ \ by\ \ people E:statement  by  people

P ( H ) : P ( l i b r a r i a n ) = 1 1 + 50 = 0.0196 P(H):P(librarian)=\frac{1}{1+50}=0.0196 P(H):P(librarian)=1+501=0.0196

P ( H ˉ ) : P ( f a r m e r ) = 50 1 + 50 = 0.9804 P(\bar H):P(farmer)=\frac{50}{1+50}=0.9804 P(Hˉ):P(farmer)=1+5050=0.9804

假设: P ( E ∣ H ) = 0.5       P ( E ∣ H ˉ ) = 0.1 P(E|H)=0.5\ \ \ \ \ P(E|\bar H)=0.1 P(EH)=0.5     P(EHˉ)=0.1

P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(H|E)=\frac{P(E|H)P(H)}{P(E|H)P(H)+P(E|\bar H)P(\bar H)} P(HE)=P(EH)P(H)+P(EHˉ)P(Hˉ)P(EH)P(H)

P ( H ∣ E ) = 0.5 × 0.0196 0.5 × 0.0196 + 0.1 × 0.9804 = 0.0909 P(H|E)=\frac{0.5\times0.0196}{0.5\times0.0196+0.1\times0.9804}=0.0909 P(HE)=0.5×0.0196+0.1×0.98040.5×0.0196=0.0909

所以得出:在证据 E E E 成立(人们对小明的描述)的情况下, H H H 事件(假设小明为图书管理员)发生的概率为 9.09%

案例二

你被检验出可能有一种罕见疾病

  • 在人群中只有0.1%的人会得病

这个测试非常准确

  • 如果有这个疾病,检查准确率达到99%
  • 如果没有这个疾病,会有2%的误诊为患者
1000人的样本空间阳性概率
疾病11 1 20 + 1 \frac{1}{20+1} 20+11
健康99920 20 20 + 1 \frac{20}{20+1} 20+120

带入贝叶斯公式

E E E : 你被检验出有罕见病

P ( H ) : 患病概率 = 0.001 P(H):患病概率=0.001 P(H):患病概率=0.001 (先验概率)

P ( H ˉ ) = 0.999 P(\bar H)=0.999 P(Hˉ)=0.999

P ( E ∣ H ) : s e n s i t i v i t y = 0.99 P(E|H):sensitivity=0.99 P(EH):sensitivity=0.99(真阳)

P ( E ∣ H ˉ ) : f a l s e   p o s i t i v e   r a t e = 0.02 P(E|\bar H):false\ positive\ rate=0.02 P(EHˉ):false positive rate=0.02(假阳)

P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(H|E)=\frac{P(E|H)P(H)}{P(E|H)P(H)+P(E|\bar H)P(\bar H)} P(HE)=P(EH)P(H)+P(EHˉ)P(Hˉ)P(EH)P(H)

P ( H ∣ E ) = 0.99 × 0.001 0.99 × 0.001 + 0.02 × 0.999 = 0.0472 P(H|E)=\frac{0.99\times0.001}{0.99\times0.001+0.02\times0.999}=0.0472 P(HE)=0.99×0.001+0.02×0.9990.99×0.001=0.0472(后验概率)

通过贝叶斯计算,你被检验出患有罕见病时,你真正患病的概率只有4.72%

如果再次检测还是为阳性

此时的相关证据与假设概率如下

P ( H ) = 0.0472 P(H)=0.0472 P(H)=0.0472(后验概率:在第一次测得阳性的概率)

P ( H ˉ ) = 0.9528 P(\bar H)=0.9528 P(Hˉ)=0.9528

P ( E ∣ H ) : s e n s i t i v i t y = 0.99 P(E|H):sensitivity=0.99 P(EH):sensitivity=0.99(真阳)

P ( E ∣ H ˉ ) : f a l s e   p o s i t i v e   r a t e = 0.02 P(E|\bar H):false\ positive\ rate=0.02 P(EHˉ):false positive rate=0.02(假阳)

除了假设患病概率以外,其他的不变

P ( H ∣ E ) = P ( E ∣ H ) P ( H ) P ( E ∣ H ) P ( H ) + P ( E ∣ H ˉ ) P ( H ˉ ) P(H|E)=\frac{P(E|H)P(H)}{P(E|H)P(H)+P(E|\bar H)P(\bar H)} P(HE)=P(EH)P(H)+P(EHˉ)P(Hˉ)P(EH)P(H)

P ( H ∣ E ) = 0.99 × 0.0472 0.99 × 0.0472 + 0.02 × 0.9528 = 0.7103 P(H|E)=\frac{0.99\times0.0472}{0.99\times0.0472+0.02\times0.9528}=0.7103 P(HE)=0.99×0.0472+0.02×0.95280.99×0.0472=0.7103

可以看到,如果两次检测都为阳性,你患病的概率会一下子达到71.03%,与之前的4.72%形成了非常强的对比

上述的迭代运算也是贝叶斯的核心精神:通过不断的实验累积证据,从而更精准的判断一个假设是否正确

五、先验概率与后验概率

参考上述例子分析

先验概率是你提前已经知晓的概率(假设的实际概率)

后验概率是在证据成立的前提下,确定假设成立的概率

通常情况下,后验概率我们是不得而知,需要通过贝叶斯公式来求得后验概率。所以贝叶斯也是一个求后验概率的公式

而更精准的判断一个假设是否正确

五、先验概率与后验概率

参考上述例子分析

先验概率是你提前已经知晓的概率(假设的实际概率)

后验概率是在证据成立的前提下,确定假设成立的概率

通常情况下,后验概率我们是不得而知,需要通过贝叶斯公式来求得后验概率。所以贝叶斯也是一个求后验概率的公式

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐