贝叶斯的定义及核心原理

大数据精选 • 2015-11-21 02:26 • 统计学

一、什么是贝叶斯推断

贝叶斯的定义及核心原理

贝叶斯推断（Bayesian inference）是一种统计学方法，用来估计统计量的某种性质。

它是贝叶斯定理（Bayes’ theorem）的应用。英国数学家托马斯·贝叶斯（Thomas Bayes）在1763年发表的一篇论文中，首先提出了这个定理。

贝叶斯的定义及核心原理

贝叶斯推断与其他统计学推断方法截然不同。它建立在主观判断的基础上，也就是说，你可以不需要客观证据，先估计一个值，然后根据推断结果不断修正。正是因为它的主观性太强，曾经遭到许多统计学家的诟病。

贝叶斯推断需要大量的计算，因此历史上很长一段时间，无法得到广泛应用。只有等到计算机诞生以后，它才获得真正的重视。人们发现，许多统计量是无法事先进行客观判断的，而互联网时代出现的大型数据集，再加上高速运算能力，为验证这些统计量提供了方便，也为应用贝叶斯推断创造了条件，它的威力正在日益显现。

二、贝叶斯定理

要理解贝叶斯推断，就必须先理解贝叶斯定理。后者实际上就是计算”条件概率”的公式。

所谓”条件概率”（Conditional probability），就是指在事件B发生的情况下，事件A发生的概率，用P(A|B)来表示。

贝叶斯的定义及核心原理

根据文氏图，可以很清楚地看到在事件B发生的情况下，事件A发生的概率就是P(A∩B)除以P(B)。

贝叶斯的定义及核心原理

因此，

贝叶斯的定义及核心原理

同理可得，

贝叶斯的定义及核心原理

所以，

贝叶斯的定义及核心原理

即

贝叶斯的定义及核心原理

这就是条件概率的计算公式。

三、全概率公式

由于后面要用到，所以除了条件概率以外，这里还要推导全概率公式。

假定样本空间S，是两个事件A与A’的和。

贝叶斯的定义及核心原理

上图中，红色部分是事件A，绿色部分是事件A’，它们共同构成了样本空间S。

在这种情况下，事件B可以划分成两个部分。

贝叶斯的定义及核心原理

即

贝叶斯的定义及核心原理

在上一节的推导当中，我们已知

贝叶斯的定义及核心原理

所以，

贝叶斯的定义及核心原理

这就是全概率公式。它的含义是，如果A和A’构成样本空间的一个划分，那么事件B的概率，就等于A和A’的概率分别乘以B的条件概率之和。

将这个公式代入上一节的条件概率公式，就得到了条件概率的另一种写法：

贝叶斯的定义及核心原理

四、贝叶斯推断的含义

对条件概率公式进行变形，可以得到如下形式：

贝叶斯的定义及核心原理

我们把P(A)称为”先验概率”（Prior probability），即在B事件发生之前，我们对A事件概率的一个判断。P(A|B)称为”后验概率”（Posterior probability），即在B事件发生之后，我们对A事件概率的重新评估。P(B|A)/P(B)称为”可能性函数”（Likelyhood），这是一个调整因子，使得预估概率更接近真实概率。

所以，条件概率可以理解成下面的式子：

后验概率　＝　先验概率 ｘ 调整因子

这就是贝叶斯推断的含义。我们先预估一个”先验概率”，然后加入实验结果，看这个实验到底是增强还是削弱了”先验概率”，由此得到更接近事实的”后验概率”。

在这里，如果”可能性函数”P(B|A)/P(B)>1，意味着”先验概率”被增强，事件A的发生的可能性变大；如果”可能性函数”=1，意味着B事件无助于判断事件A的可能性；如果”可能性函数”<1，意味着”先验概率”被削弱，事件A的可能性变小。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

统计知识贝叶斯

赞 (1)

大数据精选编辑

0

正态分布的前世今生：误差分布曲线的确立

上一篇 2015-11-21 02:22

趣味统计学：从A到Z

下一篇 2015-11-29 21:41

关注我们

关注我们

返回顶部