统计学
-
小白学统计(21)概率分布关系:泊松分布作为二项分布近似
内容介绍: 泊松分布可用于近似二项分布,条件是:在二项试验中随机出现的成功是稀有事件,其中n“大”,p“小”。二项分布有两个参数n和p,并且均值为np。如果np在n增加而p减少的过程中保持不变,则当n趋近于无穷而p趋近0时,二项分布趋近均值为np的泊松分布。泊松分布概率函数可以由二项分布概率公式推导而出:离散型随机变量概率分布— —泊松分布。 那n的“大”和…
-
小白学统计(20)连续型随机变量概率分布——指数分布
指数分布是连续型随机变量的另一种概率分布,它主要应用在随机事件之间发生的时间间隔的概率问题。例如,用它描述电子产品由使用到发生故障的时间的概率,描述两次电话之间时间间隔的概率,描述两位顾客到达商店间隔时间的概率等。前面讲述的泊松分布是描述某一区间内发生随机事件次数的概率分布,而指数分布是描述两次随机事件发生时间间隔的概率分布。因此,两种分布有着密切的关系,在…
-
小白学统计(19)连续型随机变量概率分布——正态分布
正态概率分布是连续型随机变量概率分布中最重要的形式,它在实践中有着广泛的应用。在自然界和人类社会,有许多现象的分布都服从正态分布,如人的身高、体重、智商分数;某种产品的尺寸和质量;降雨量;学习成绩,特别是,在统计推断时,当样本的数量足够大时,许多统计数据都服从正态分布。因此,正态分布在抽样理论中占有重要地位。另外,正态分布还是其他连续型概率分布的极限分布,可…
-
小白学统计(18)连续型随机变量概率分布——平均概率分布
在了解连续型随机变量的概率分布之间,我们需要先了解概率密度函数:由于连续型随机变量的数值在某一区间内有无限多个,因此无法一一列举,其概率分布只能通过一个函数来描述,这个函数称为概率密度函数,记作f(x)。 计算连续型随机变量的概率,首先需要找到该变量的概率密度函数,然后,通过积分求出f(x)与随机变量轴所夹面积,即为概率值,如下图所示: 图中阴影部份面积即是…
-
小白学统计(17)通俗归纳连续型概率分布
两个注意点 1、离散型概率分布的概率函数称为概率质量函数,概率是散布在随机变量的各个离散值上的,所以二维坐标的纵轴为概率;连续型概率分布的概率函数被称为概率密度函数,二维坐标纵轴为密度(区别于离散型概率分布的概率),随机变量范围内任意点的概率为0(因为概率密度函数曲线下积分面积为0),随机变量取值区间的概率为曲线下积分面积。如下图所示: 2、对于任何连续型概…
-
小白学统计(16)离散型随机变量概率分布——超几何分布
超几何分布是统计学上一种重要的离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数(不归还)。 例如:在有N个样本,其中m个是不合格的。超几何分布描述了在该N个样本中抽出n个,其中k个是不合格的的概率: 或者 上式可如此理解:Cmk表示所有在N个样本中抽出n个的方法数目。CNn表示在m个不合格样本中,抽出k个的方法数目。C(N-m)…
-
小白学统计(15)简述泊松分布假设条件
基础准备 泊松分布概率公式推导自二项分布,因为换一种角度来看待它,它就是二项分布;回顾泊松分布公式推导过程及应用案例请点击下方链接: 离散型随机变量概率分布— —泊松分布 背景介绍 泊松分布是一种在现实生活中运用比较广的离散型概率分布模型,它可以恰当的计算某些事件发生的概率,例如:工厂生产的电缆上出现的缺陷个数;1立方厘米血液中白细胞的个数;一辆崭新的汽车表…
-
小白学统计(14)离散型随机变量概率分布——泊松分布
上一篇文章中,我们介绍了离散型随机变量的二项分布,为了便于各位统子的知识串联和掌握,下面将介绍由二项分布公式到泊松分布公式的推导过程。 推导过程: 二项分布概率公式: 表示为X~B(n,p)(二项分布概率公式解释及应用实例,请见上一篇) 下面我们做以下假定条件: 一个事件在一段时间或空间内发生的平均次数或数学期望为λ; 我们将这段时间或空间分成n等份,在每一…
-
小白学统计(13)离散型随机变量概率分布——二项分布
所谓概率分布,是指随机变量的取值与该取值发生概率所构成的分布。概率分布描述了一个随机变量的所有取值与其相应概率值之间的关系。它可以分为离散型概率分布和连续型概率分布(离散型及连续型随机变量分类见上一篇)。 离散型概率分布主要有以下三种: 二项分布 泊松分布 超集合概率分布 今天介绍的是离散型随机变量的二项分布。 在许多试验中,结果往往只有两个。例如:检查产品…
-
一克统计学:人人都能懂的贝叶斯定理
大道至简
-
小白学统计(12)——通俗归纳离散型概率分布
基础准备 随机变量回顾请见第8篇《随机变量的种类与描述》 概率回顾请见第5篇《推断理论基础——概率》 两个概念 随机变量分类:离散型随机变量和连续性随机变量。可以用“点”和“线”来类比理解。“点”(离散型)就是随机变量的取值是有限个或可列无限个。“线”(连续型)就是随机变量的取值在某一段区间上可以取无线多个。 概率分布:是指随机变量的取值与其概率所构成的分布…
-
小白学统计(11)——随机变量的种类与描述
研究随机现象中存在的统计规律性,可以将随机现象的结果与实际数值对应起来,即将结果数量化。因为随机现象如果可以用数值来描述,那么就可以将数学分析的方法引入到随机现象的研究中。 有些实验结果是用数值表现的,我们可以直接用这些数值代表随机变量的数值,如掷骰子的点数。但有一些试验的结果并不是数值,而是各种态度,观点和属性,如记录顾客的性别,对于这样的试验结果,我们通…
-
小白学统计(10)——贝叶斯定理(统计在生活中的应用)
贝叶斯(Thomas Bayes, 1701—1761)是英国人,主要职业是牧师,业余爱好才是数学。他为了证明上帝的存在,发明了概率统计学原理,虽然他的这一美好愿望至死也未能实现,却为统计学的发展做出了巨大的贡献。
-
小白学统计(9)——贝叶斯定理(概率的修正方法)
贝叶斯定理是用来描述两个条件概率之间关系的定理,比如P(A|B)和P(B|A),通常,事件A在事件B发生的条件下的概率{P(A|B)}与事件B在事件A的条件下的概率{P(B|A)}是不一样的,但是这两者之间有确定的关系,贝叶斯法则就是这种关系的陈述,按照乘法法则:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B),可以立刻导出P(B|A)=P(A|…
-
小白学统计(8)——概率的基本运算法则
学习概率运算法则之前,需要知道事件之间的关系。事件之间的关系有以下三种: 1)事件的补。事件A的补就是所有在样本空间S内但不包括在A内的所有样本点的集合。A的补用表示。 2)两事件的并。属于事件A或属于事件B或同事属于事件A和B的样本点组成的集合。记作。 3)两事件的交。同事属于事件A和事件B的样本点的集合。记作 4)互斥事件。如果事件A发生,则事件B就不发…