贝叶斯定理在统计学基础《贝叶斯定理——概率的修正方法》中已经介绍过,最近再次遇到这个概念,觉得很能体现统计学在生活中的应用,所以分享出来,和大家一起细细咀嚼。
背景介绍
贝叶斯(Thomas Bayes, 1701—1761)是英国人,主要职业是牧师,业余爱好才是数学。他为了证明上帝的存在,发明了概率统计学原理,虽然他的这一美好愿望至死也未能实现,却为统计学的发展做出了巨大的贡献。
维基百科中对贝叶斯定理来源的描述:所谓的贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大”。而一个自然而然的问题是反过来:”如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题,就是所谓的逆概问题。
定理回顾
通俗解释贝叶斯定理:在运用概率对某一事件进行推断之前,我们往往已经事先掌握了关于这一事件的概率,这个概率可能是主观概率或者相对概率(回顾概念,请回复5),这种初始的概率可以称为先验概率。如果在后续的研究中,通过抽样调查样本等消息源又获得了有关该事件的信息,我们就可以根据这些新信息对先验概率进行修正,使先验概率变为后验概率。这个修正概率的定理就称为贝叶斯定理。
贝叶斯定理公式:
详解个例子让大家更好理解:假定A,B,C三个工厂生产同一种零件市场占有率分别为10%、25%和65%。已知A,B,C三家工厂生产零件的不合格率分别是30%、20%和10%。现从市场上某一批零件中随机抽取一件,经检验该零件不合格,则这个零件由A,B,C生产的概率分别是多少?
解:在没有抽取零件之前,我们知道来自A,B,C三个工厂的产品分别占10%, 25%, 65%,这些就是先验概率。现在我们在市场上抽取的产品是不合格品,这是一个新的信息,我们利用这个信息可以得到后验概率。分析过程见下表:
A, B, C三个生产一件不合格零件的情况表 | ||||
工厂 | 先验概率 | 条件概率 | 联合概率 | 后验概率 |
A
B C | 0.1
0.25 0.65 | 0.3
0.2 0.1 | 0.1*0.3=0.03
0.25*0.2=0.05 0.65*0.1=0.065 | 0.03/0.145=0.207
0.05/0.145=0.345 0.065/0.145=0.448 |
1.00 | – | 0.145 | 1.000 |
我们可以看到先验概率与后验概率之间发生了变化,这就是条件概率对先验概率的修正。
生活应用
下面的例子是医学的常见问题,与现实生活关系紧密。
有一种疾病的发病率是千分之一,医院有一种化验技术可以对这种疾病进行诊断,但是有百分之五的误诊率(也即是说尽管有百分之五的人没有病,但是化验结果却显示为阳性(即假阳性))。现在假设一个人的化验结果显示为有病,仅根据这一化验结果推测,那么这个人确实患病的概率有多大?
这个问题的分析过程如下:
先验概率:
P(患病)=0.001
P(正常)=0.999
条件概率(新信息):
P(准确率)=1.00;准确率(患病者100%被检出)。
P(误诊率)=0.05;误诊率(正常人有5%被误检)。
根据上面的数据,我们就能够推测出一个人化验为阳性的情况下,这个人确实患病的概率(后验概率)为:
P(患病|阳性)=P(患病)×P(准确率)/[(P(患病)×P(准确率)+P(正常)×P(误诊率)]
=0.001×1.00/(0.001×1.00+0.999×0.05)
=0.0198
=2%
结果让你大吃一惊吧,在没有其他症状增加患病概率的情况下,单凭化验结果显示为阳性来推测的话,其真实患病的概率还不到2%。所以对于年度常规体检出现的问题,应该进行复检。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。