统计学
-
小白学统计(41)假设检验的“前世今生”
概率理论和抽样理论是推断性统计的基础,而估计理论和假设检验理论是推断性统计的应用。
-
小白学统计(40)样本容量确定——估计总体方差的样本容量
样本容量通常是由给定的抽样误差大小来确定。但是在由卡方(χ2)分布推导σ2的置信区间中,并没有提供抽样误差的形式。由卡方(χ2)分布的性质可知,随着样本容量n的增大,卡方(χ2)分布越来越对称,当n的数量充分大时,分布就近似正态分布。因此,在一定条件下,我们可以利用卡方(χ2)分布的这一特征,确定估计σ2时的样本容量。 如果来自正态总体的n很大(n≥100)…
-
小白学统计(39)抽样分布:卡方分布
基础准备 之前已经具体介绍了不同已知条件下用样本均值来估计总体均值的方法: 小白学统计(32)估计理论:详述总体均值的单样本估计原理 小白学统计(35)不同条件的总体均值单样本估计方法总述 回顾总体均值的单样本估计,根据不同已知条件,可以对样本的抽样分布运用标准正态变换、t分布或切比雪夫(Chebyshev)不等式进行总体均值的估计。 那如何用样本方差(标准…
-
小白学统计(38)样本容量确定——总体成数P的样本容量
如果抽样的目的是估计总体成数P的置信区间,则在给定的总体成数抽样误差△P和置信度1-α的条件下,可由以下公式确定样本容量。 从上面的式子中可以看到,都有要估计的总体成数P。因此,在计算n时,必须先确定一个P值。通常P可以通过以下几种方式确定: 1、用以前类似研究的最接近0.5的样本成数代替,这样可以使n较大; 2、通过试点调查,用样本成数代替P; 3、直接用…
-
小白学统计(37)区间估计— —总体成数的置信区间
在实践中,有许多情况要对总体成数进行估计。例如,通过样本合格品率估计总体的合格品率;通过样本的支持率估计总体的支持率等,这些都属于成数的估计问题。下面我们用p表示总体成数;用`p表示样本成数。对总体成数进行估计,就是用`p去估计p。当n为小样本时,`p为离散型变量,`p的概率分布为二项式分布。当n为大样本时,如果np>5,同时n(1-p)>5,则…
-
小白学统计(36)样本容量的确定—总体均值的样本容量确定
在抽样之前,确定适当的样本容量是必须的。因为样本容量直接影响到抽样的误差大小以及抽样费用的多少。如果样本容量较大,就会减少抽样误差,提高估计总体参数的精度,但是抽样的费用就会相应增加;反之,样本容量较小,抽样费用可以降低,但抽样误差就会增大。所以,在抽样之前必须确定一个适当的样本容量。 所谓适当的样本容量,就是指能够满足研究者对抽样误差要求的应抽取的最少样本…
-
如何成为一名数据科学家?
数据科学需要哪些技能?如何才能学会这些技能?
-
小白学统计(35)不同条件的总体均值单样本估计方法总述
基础准备 均值抽样分布: 小白学统计(25)通俗解释“大数据”及推断性统计学:抽样分布 小白学统计(27)抽样分布:详述均值的抽样分布及中心极限定理 小白学统计(28)抽样分布:t分布 估计原理:小白学统计(32)估计理论:详述总体均值的单样本估计原理 总体均值单样本估计条件 上一篇(回顾:小白学统计(32)估计理论:详述总体均值的单样本估计原理)进行总体均…
-
小白学统计(34)总体参数的区间估计——小样本(n<30)条件下总体均值?的区间估计
当n<30时,总体分布对样本均值`X的抽样分布有很大影响。如果总体服从正态分布,则`X服从正态分布;如果总体不服从正态分布,则`X的抽样分布很难判断,这时可以利用切比雪夫不等式对总体均值进行估计(后面会详细叙述)。下面我们仅介绍总体服从正态分布时,均值的区间估计。 1、总体标准差σ已知,的置信度为1-α的置信区间和大样本(n≥30)的公式一致 2、 总…
-
小白学统计(33)大样本(n≥30)条件下总体均值?的区间估计
大样本(n≥30)条件下的区间估计 当样本容量为大样本时,根据中心极限定理,样本均值`X的抽样分布以正态分布为极限,此时可以不用考虑通体的分布形式。估计时,根据总体标准差σ是否已知分为两种形式: 1、 总体标准差σ已知,的置信度为1-α的置信区间为 `X-Zα/2*σ/n<<`X+Zα/2*σ/n 2、 总体标准差σ未知,的置信度为1-α的置信区…
-
Stack Overflow“数据科学家”工作一年总结
人们了解网络开发者的工作,但是“数据科学家”是做什么的呢?(我可不是唯一一个被这么问的人。)
-
什么是非参数统计?
在对总体的分布不作假设或仅作非常一般性假设条件下的统计方法称为“非参数统计”。
-
小白学统计(32)估计理论:详述总体均值的单样本估计原理
基础准备 推断性统计学是统计科学的一部分,它提供了从样本特征对整个总体特征做出推断的逻辑和方法。推断性统计学在理论上有4个组成部分:概率论、抽样理论、估计理论和假设检验理论。这篇讲述估计理论在总体均值的单样本估计中的应用。 概率论:小白学统计(7)——推断理论基础(概率) 抽样理论: 小白学统计(24)推断性统计学:抽样设计 小白学统计(25)通俗解释“大数…
-
什么是方差?
方差是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。
-
小白学统计(31)推断统计基础:置信度与置信区间
基础准备 结束了描述性统计学部分的内容后,就进入到推断统计学阶段。在这个阶段,主要任务就是交给大家用样本信息推断总体信息的原理及方法。点估计和区间估计,置信度和置信区间是推断性统计学的基础性内容。统计基础请前往下方获取导航页。 概念定义 先定义一些区间估计的概念: θ:待估计的总体参数; θL:由样本确定的置信下限; θU:由样本确定的置信上限; α:显著性…