两个注意点
1、离散型概率分布的概率函数称为概率质量函数,概率是散布在随机变量的各个离散值上的,所以二维坐标的纵轴为概率;连续型概率分布的概率函数被称为概率密度函数,二维坐标纵轴为密度(区别于离散型概率分布的概率),随机变量范围内任意点的概率为0(因为概率密度函数曲线下积分面积为0),随机变量取值区间的概率为曲线下积分面积。如下图所示:
2、对于任何连续型概率分布,曲线下方总面积为1.0(概率总和100%)。
主要离散型概率分布
- 正态分布
- 连续型均匀概率分布
- 指数分布
正态分布
正态概率分布是统计学中最重要的连续型分布,正态分布的曲线酷似钟型,并且关于均值上的垂线对称。于是,曲线下方的面积有50%处于这条曲线的左边,50%处于右边,曲线向着正无穷和负无穷连续延生,即在两个方向上越来越接近横轴但永不相交。现实生活中许多随机变量是正态分布:某一男性群体的身高,一批甜瓜的重量,一群妇女的血压等等。
对于正态分布有一个经验法则:对于任意近似正态分布的总体,大约68.3%的数据位于区间±σ内,大于95.4%的数据位于区间±2σ内,大约99.7%的数据位于区间±3σ内。这种推广对于近似正态分布的样本亦成立(为均值,σ为标准差)。这个法则是工业生产中运用广泛的质量控制方法—六西格玛法则的基础(图书资源:统计应用之六西格玛质量管理),如下图所示:
连续型均匀概率分布
均匀概率分布特征:随机变量X的所有取值有相等的概率。这里用离散型均匀分布的例子引入:投掷骰子就是一个典型的离散型均匀分布,投掷的结果(从1到6)的概率相等,都是1/6;如果将例中离散型随机变量的取值(骰子1到6)换成连续型随机变量的取值区域(0≤x≤6),随机变量在该区域内可以任意取值,且概率为常数(1/6),就是连续型概率分布。
指数分布
是否还记得离散型分布类型中的泊松分布(回顾请见:离散型随机变量概率分布— —泊松分布)?泊松分布是在过去经验值(在一段时间或空间内,随机事件的平均成功次数)的基础上,预测将来在同样长的时间或空间内随机事件成功次数的概率分布。
指数分布:如果一个随机事件的发生是泊松过程(回顾请见:简述泊松分布假设条件),则事件相继发生的间隔时间或空间是指数分布的。指数分布曲线:
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。