所谓概率分布,是指随机变量的取值与该取值发生概率所构成的分布。概率分布描述了一个随机变量的所有取值与其相应概率值之间的关系。它可以分为离散型概率分布和连续型概率分布(离散型及连续型随机变量分类见上一篇)。
离散型概率分布主要有以下三种:
- 二项分布
- 泊松分布
- 超集合概率分布
今天介绍的是离散型随机变量的二项分布。
在许多试验中,结果往往只有两个。例如:检查产品的质量,其结果只有两个:合格与不合格;对某种洗发液消费者的调查结果是:喜欢和不喜欢;拨打一次电话的结果:接通与没接通。如果试验的结果多于两个,但我们只关心其中一个结果,也可以视为只有两个结果,例如,调查教育程度时,结果有文盲、小学、初中、高中、大学,但我们只对大学感兴趣,则这个试验的结果也只看作两个:大学和不是大学。
通常把上述试验的两个结果(或可以看作两个结果的)分别用“成功”和“失败”来代替。一般用“成功”表示我们感兴趣的结果,“失败”表示我们不感兴趣的结果。成功的概率用p表示,失败的概率用q=1-p表示。这一类的试验我们称为伯努利试验。
如果进行n次伯努利试验,则“成功”的次数是一个随机变量,其概率分布被称为二项分布。二项分布的函数表达式为:
其中n为试验次数;x为n次试验中“成功”的次数;P为每次试验中“成功”的概率;q=1-p为每次试验中“失败”概率。如果随机变量X服从二项分布,记为X~B(n,p)。称为n和p是二项分布的参数,即通过n和p可以确定一个二项分布。
例子:已知某设备厂生产的产品中约有10%的次品,且次品的出现是随机的。求:
(1)随机抽取5件产品,其中有2件是次品的概率;
(2)随机抽取5件产品,最多有1件次品的概率;
解:按照前面的解释,我们可以将次品定义为“成功”且p=0.1。设X表示实验中出现次品的数量,则X~B(5, 0.1)。
为了方便二项分布的计算,统计学家编制了二项分布表,表中将不同的n和p值列出。当给定X值时,可以直接从表中查出概率值。部分二项分布表如下:
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。