基础准备
在解释概率分布图时,草堂君介绍了离散型概率分布图和连续性概率分布图,它们的横轴和纵轴分别代表什么含义。
下面介绍离散型概率分布和连续性概率分布的常用类型,这些概率分布类型其实都来源于生活实际,代表了生活规律。需要注意,这里的离散型和连续性是根据数据的连续性来分的;通俗解释:离散型数据和连续性数据,可以用“点”和“线”来类比理解,“点”(离散型)就是数据的取值是有限个或可列无限个,“线”(连续型)就是数据的取值在某一段区间上可以取无限多个。
常见的概率分布
离散型概率分布的常见类型有:二项分布,多项分布,超几何分布和泊松分布;而常见的连续性概率分布类型有:均匀分布,指数分布和正态分布,其中正态分布是最常见也是最重要的概率分布类型之一。
二项分布和多项分布
在生活中,许多行为(试验)的结果只有两个“A”和“非A”,例如:检查产品的质量,其结果只有两个:合格与不合格;如果试验的结果多于两个,但只关心其中一个结果,也可以视为只有两个结果,例如,调查教育程度时,结果有文盲、小学、初中、高中、大学以上,如果自关心大学以上,那么所有结果可以分成两类:大学以上和非大学以上。如果两个结果的发生概率已知,那么从总体中抽取N个个体,这N个个体中,有K个个体的结果是A的概率可以求解,由这些(1个,2个,……,K个)概率组成的概率分布称为二项分布。多项分布是二项分布的推广,二项分布试验的结果只有两个,多项分布的试验结果有多个,例如,一场足球比赛的结果有胜、平和负。
超几何分布
在二项分布试验和多项分布试验中,每个结果的发生概率是恒定不变的,而超几何分布试验结果的发生概率会随着每一次试验发生变化。例如,在抽样试验中,二项分布试验和多项分布试验是有放回抽样(总量不变)或无限总体无放回抽样(总量近似不变,一般抽样比例低于5%);超几何分布就是有限总体无放回抽样(总量变化)。例如,已知在20件产品中有2件次品,18件正品,如果随机抽出3件,那么抽到0件,1件和2件次品的概率组合就称为超几何分布。
泊松分布
泊松分布描述的是,基于过去的经验(随机事件在某段时间或某个空间发生的平均数),预测该随机事件在新的同样长的时间或同样大的空间中发生N次的概率。泊松分布经常用于商业中的库存控制。诸如,一家海鲜餐厅过去一个月顾客平均订购7只龙虾,如果该餐厅希望今后能有95%的把握满足顾客需求,需要储存龙虾的数量。
正态分布
正态分布是生活中最常见的概率分布之一。正态分布的曲线酷似钟型,并且关于均值上的垂线对称。于是,曲线下方的面积有50%处于这条曲线的左边,50%处于右边,曲线向着正无穷和负无穷连续延生,即在两个方向上越来越接近横轴但永不相交。现实生活中许多随机变量是正态分布:某一男性群体的身高,一批甜瓜的重量,一群妇女的血压等等。
均匀分布
均匀概率分布特征:随机变量X的所有取值有相等的概率。这里用离散型均匀分布的例子引入:投掷骰子就是一个典型的离散型均匀分布,投掷的结果(从1到6)的概率相等,都是1/6;如果将例中离散型随机变量的取值(骰子1到6)换成连续型随机变量的取值区域(0≤x≤6),随机变量在该区域内可以任意取值,且概率为常数(1/6),就是连续型概率分布。
指数分布
指数分布主要应用于随机事件之间发生的时间间隔的概率问题。例如,描述电子产品由使用到发生故障的时间的概率;描述两次电话之间时间间隔的概率;描述两位顾客到达商店间隔时间的概率等。前面讲述的泊松分布是描述某一区间内发生随机事件次数的概率分布,而指数分布是描述两次随机事件发生时间间隔的概率分布。因此,两种分布有着密切的关系,在管理科学中经常将两者结合起来共同解决排队理论等有关问题。
本文为专栏文章,来自:生活统计学,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/123872.html 。