统计学
-
贝叶斯告诉你:投掷硬币概率可以是90%
信贝爷, 得永生!
-
小白学统计(45)单样本的假设检验
基础准备 假设检验基础概念回顾: 小白学统计(41)假设检验的“前世今生” 单样本假设检验的应用 假设检验需要设立一对统计假设:原假设(零假设)和备择假设(对立假设)。其中原假设一般是一明确的语句:未知的总体参数等于某个特殊的数值,然后对其进行检验。因此,单样本假设检验可用于探测参数的变化,例如:在科学研究中,检验某新型的汽油添加剂是否能增加每升油的行驶公里…
-
小白学统计(44)假设检验原理:两类错误
在进行假设检验时,一般按以下四个步骤顺序进行:1、根据问题建立原假设和备择假设;2、选择适当的样本统计量,并确定以H0为真时的抽样分布;3、选定显著性水平α,确定临界值;4、进行判别,得出结论。
-
小白学统计(43)假设检验原理——接受域和拒绝域
假设设定以后,需要设定一个判别标准,用以判断样本数据为多少时才可以接受原假设或者拒绝原假设。
-
小白学统计(42)假设检验原理——原假设和备择假设的建立
在参数检验中,首先要对某一总体参数建立一个假设,并在随后的抽样推断中以这一假设为前提进行检验。这一假设被称为原假设,用H0表示。如果检验的结果不能拒绝原假设,就接收这一假设。
-
小白学统计(41)假设检验的“前世今生”
概率理论和抽样理论是推断性统计的基础,而估计理论和假设检验理论是推断性统计的应用。
-
小白学统计(40)样本容量确定——估计总体方差的样本容量
样本容量通常是由给定的抽样误差大小来确定。但是在由卡方(χ2)分布推导σ2的置信区间中,并没有提供抽样误差的形式。由卡方(χ2)分布的性质可知,随着样本容量n的增大,卡方(χ2)分布越来越对称,当n的数量充分大时,分布就近似正态分布。因此,在一定条件下,我们可以利用卡方(χ2)分布的这一特征,确定估计σ2时的样本容量。 如果来自正态总体的n很大(n≥100)…
-
小白学统计(39)抽样分布:卡方分布
基础准备 之前已经具体介绍了不同已知条件下用样本均值来估计总体均值的方法: 小白学统计(32)估计理论:详述总体均值的单样本估计原理 小白学统计(35)不同条件的总体均值单样本估计方法总述 回顾总体均值的单样本估计,根据不同已知条件,可以对样本的抽样分布运用标准正态变换、t分布或切比雪夫(Chebyshev)不等式进行总体均值的估计。 那如何用样本方差(标准…
-
小白学统计(38)样本容量确定——总体成数P的样本容量
如果抽样的目的是估计总体成数P的置信区间,则在给定的总体成数抽样误差△P和置信度1-α的条件下,可由以下公式确定样本容量。 从上面的式子中可以看到,都有要估计的总体成数P。因此,在计算n时,必须先确定一个P值。通常P可以通过以下几种方式确定: 1、用以前类似研究的最接近0.5的样本成数代替,这样可以使n较大; 2、通过试点调查,用样本成数代替P; 3、直接用…
-
小白学统计(37)区间估计— —总体成数的置信区间
在实践中,有许多情况要对总体成数进行估计。例如,通过样本合格品率估计总体的合格品率;通过样本的支持率估计总体的支持率等,这些都属于成数的估计问题。下面我们用p表示总体成数;用`p表示样本成数。对总体成数进行估计,就是用`p去估计p。当n为小样本时,`p为离散型变量,`p的概率分布为二项式分布。当n为大样本时,如果np>5,同时n(1-p)>5,则…
-
小白学统计(36)样本容量的确定—总体均值的样本容量确定
在抽样之前,确定适当的样本容量是必须的。因为样本容量直接影响到抽样的误差大小以及抽样费用的多少。如果样本容量较大,就会减少抽样误差,提高估计总体参数的精度,但是抽样的费用就会相应增加;反之,样本容量较小,抽样费用可以降低,但抽样误差就会增大。所以,在抽样之前必须确定一个适当的样本容量。 所谓适当的样本容量,就是指能够满足研究者对抽样误差要求的应抽取的最少样本…
-
小白学统计(35)不同条件的总体均值单样本估计方法总述
基础准备 均值抽样分布: 小白学统计(25)通俗解释“大数据”及推断性统计学:抽样分布 小白学统计(27)抽样分布:详述均值的抽样分布及中心极限定理 小白学统计(28)抽样分布:t分布 估计原理:小白学统计(32)估计理论:详述总体均值的单样本估计原理 总体均值单样本估计条件 上一篇(回顾:小白学统计(32)估计理论:详述总体均值的单样本估计原理)进行总体均…
-
小白学统计(34)总体参数的区间估计——小样本(n<30)条件下总体均值?的区间估计
当n<30时,总体分布对样本均值`X的抽样分布有很大影响。如果总体服从正态分布,则`X服从正态分布;如果总体不服从正态分布,则`X的抽样分布很难判断,这时可以利用切比雪夫不等式对总体均值进行估计(后面会详细叙述)。下面我们仅介绍总体服从正态分布时,均值的区间估计。 1、总体标准差σ已知,的置信度为1-α的置信区间和大样本(n≥30)的公式一致 2、 总…
-
小白学统计(33)大样本(n≥30)条件下总体均值?的区间估计
大样本(n≥30)条件下的区间估计 当样本容量为大样本时,根据中心极限定理,样本均值`X的抽样分布以正态分布为极限,此时可以不用考虑通体的分布形式。估计时,根据总体标准差σ是否已知分为两种形式: 1、 总体标准差σ已知,的置信度为1-α的置信区间为 `X-Zα/2*σ/n<<`X+Zα/2*σ/n 2、 总体标准差σ未知,的置信度为1-α的置信区…
-
什么是非参数统计?
在对总体的分布不作假设或仅作非常一般性假设条件下的统计方法称为“非参数统计”。