小白学统计(45)单样本的假设检验

基础准备

假设检验基础概念回顾:

小白学统计(41)假设检验的“前世今生”

单样本假设检验的应用

假设检验需要设立一对统计假设:原假设(零假设)和备择假设(对立假设)。其中原假设一般是一明确的语句:未知的总体参数等于某个特殊的数值,然后对其进行检验。因此,单样本假设检验可用于探测参数的变化,例如:在科学研究中,检验某新型的汽油添加剂是否能增加每升油的行驶公里数?某新型血压药对体温是否有影响?在工业质量控制中,工厂检查其薯片产品是否与列在包装上的脂肪含量一致;检查巧克力的重量是否与包装上重量一致等等。

单样本假设检验步骤

单样本假设检验步骤如下:

(1)选择零假设和对立假设;

(2)选择显著水平α;

(3)决定检验统计量,由此统计量及α来确定检验的决策规则,并用P值或临界值描述;

(4)从总体取一随机样本,并从样本计算检验统计量的值,若可能,计算P值;

(5)由样本结果和决策规则决定是拒绝还是接受原假设(零假设);

(6)检验的功效。

(1)选择零假设和对立假设

一个零假设和一个对立假设组成一对统计假设(原假设和对立假设的概念描述请回顾:假设检验原理——原假设和备择假设的建立),这样成对的统计假设可以分为两类三种:单侧假设检验和双侧假设检验(两类);无方向对立假设、左向对立假设和右向对立假设(三种)。那如何选择统计假设呢?

单侧假设检验:只有一个方向上的变化是重要的(某种新型减肥药实际减肥多少)或研究的假设预告了一个具体的变化方向(某种新的治疗肿瘤会减小)时用单侧假设合适。有的需要检验是否变大,有的检验是否变小。

双侧假设检验:对于探索性研究和质量控制,因为任何一个方向的变化都要检查,单检验就不合适了,应该用双侧假设检验,例如控制产品的重量和产品内某种物质的含量。

(2)选择显著水平α

回忆估计理论,总体均值的区间估计概率公式如下:

其中,1-α称为置信度或置信系数,(1-α)100%称为置信水平。以双尾为例,如下图:

小白学统计(45)单样本的假设检验

在假设检验理论中,α是假设检验的显著水平,这是因为它用以评估样本结果的显著性,如果点估计值与零假设中的假设参数有很大差别,以至于P≤α,则拒绝零假设,该结果称为统计显著;如果P>α,则接受零假设,该结果称为不是统计显著的。如上图所示,临界域即为统计显著域,接受域为非统计显著域。

显著水平α在试验前设定为0.05或0.01。例如当α=0.05时,分析人员会在报告中说明“统计假设检验是在0.05显著水平(或5%显著水平)下进行的”,如果P≤0.05,则拒绝零假设,该结果称为统计显著;如果P>0.05,则接受零假设,该结果称为不是统计显著的。

从上图中可以看出,如果P≤0.05,阴影面积比P≤0.01的大,所以P≤0.05可说成是“显著的结果”,P≤0.01可说成是“高度显著的结果”。P≤0.01比P≤0.05发生第一类错误的概率α小。

(3)决定检验统计量,由此统计量及α来确定检验的决策规则,并用P值或临界值描述;

(4)从总体取一随机样本,并从样本计算检验统计量的值,若可能,计算P值;

根据假设检验的总体参数和已知的信息,选择假设检验的统计量。在上一篇:假设检验的“前世今生”中解释过合适的统计量是假设检验的基础。

对于总体均值的假设检验,可用下表选择:

小白学统计(45)单样本的假设检验

对于总体方差的假设检验,可以用卡方分布。

下面以Z统计量为例,说明假设检验原理:

如果在(1)中设定的总体均值的统计假设是双侧假设:H0:μ=μ0;H1:μ≠μ0。假定零假设为真,则可知:如果所有容量为n的随机样本来自于无限大的正态总体(已知标准差为σ),且对每一样本计算均值,该情况下均值的抽样分布是正态分布:

小白学统计(45)单样本的假设检验

因为抽样分布为正态分布,可进行正态变换,将抽样分布统计量变换为Z统计量:

小白学统计(45)单样本的假设检验

变换后的Z统计量可以用来度量零假设为真的可能性。如果对一个给定样本计算Z统计量的特定值,几座z1,若z1=0,该样本均值一定等于μ0(红框公式),因而H0:μ=μ0很可能为真。然后,当z1是一较大数时,在零的正或负向,即z1=α或z1=-α,则样本均值与μ0有相当距离,因此,H0:μ=μ0不太可能为真。通过计算P值,即可将可能性量化,进而进行统计假设检验决策。如下图所示:

小白学统计(45)单样本的假设检验

P值得计算:

对于双侧假设检验,P值就是两个阴影部分的面积和(如上图所示);如果是单侧假设检验,就是左侧面积或者右侧面积。阴影部分面积用标准正态分布表查得。

(5)由样本结果和决策规则决定是拒绝还是接受原假设(零假设);

将计算得到的P值与显著水平α比较,P≤α,则拒绝零假设,接受对立假设;如果P>α,则接受零假设。

另外也可以通过比较临界z值来决定是拒绝还是接受零假设。因为P值和z值是等价的,例如,如果z1>1.645成立,则P≤0.05成立。

(6)检验的功效

在两类错误介绍中:假设检验——两类错误,可列出下面的表格:

小白学统计(45)单样本的假设检验

从表格可以知道,第一类错误(零假设为真拒绝)的概率α是检验的显著性水平:若P≤α,则拒绝零假设。然而在任何此种统计决策中,存在第二类错误:就是零假设不真被接受,它的概率是β。α和1-α是已知的,由研究者在检验前设置,但β和1-β的值是不能确定的,因为不知道总体的参数,所以无法证明H0的真与不真。但是α和β的关系是相反的:α越大,β越小,反之亦然。如下图所示:α越大,接受域越小,接受不真的零假设的概率β也越小。

小白学统计(45)单样本的假设检验

假设检验的功效就是正确拒绝错误零假设的概率1-β。求解方法见例题。

范例分析

如果某电池生产商最近设立了一个改进计算器电池的项目,要求改进的电池比现有的电池使用时间长,已知现在计算器中,电池寿命的量度是正态分布的,均值为100.3min,标准差为

6.25min。现在开发了一种改进电池,在理论上可能持续更长时间,由初步检验可以假定期寿命量度也是正态分布,标准差为6.25min。选取了一个n=20的改进电池的样本,得到均值为

105.6min,在显著水平α=0.05下,作H0: μ=100.3min的单侧检验,并用P值(z值)叙述决策。

小白学统计(45)单样本的假设检验
小白学统计(45)单样本的假设检验

假设功效,如下图所示:

小白学统计(45)单样本的假设检验

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(1)
生活统计学的头像生活统计学专栏
上一篇 2016-09-21 06:57
下一篇 2016-09-22

相关文章

  • 一个计算我的妻子是否怀孕的贝叶斯模型

    在2015年的二月21日,我的妻子已经33天没有来月经了,她怀孕了,这真是天大的好消息!通常月经的周期是大约一个月,如果你们夫妇打算怀孕,那么月经没来或许是一个好消息。但是33天,这还无法确定这是一个消失的月经周期,或许只是来晚了,那么它是否真的是一个好消息?

    2016-08-12
    0
  • 说人话的统计学 | 贝叶斯vs频率派:武功到底哪家强?

    运用之妙,存乎一心,正所谓“无招胜有招”才是最高境界,你说是吗?

    2015-09-24
    0
  • 让人纠结的统计学P值

    每次研究生答辩,委员会们为了显示自己的认真负责态度,都会对统计学方法,统计学差异,P值等问题特别重视。虽然大家显然对这个问题都是一知半解,甚至误解。 关于统计学的争议最多的就是P值,就是这个大写斜体的P值。无数论文和博客曾经写过这个“无效假设检验”话题。无效假设检验是统计学的基本原理和基石,是指根据于某种实际需要,对未知的或不完全知道的统计总体提出一些假设。…

    2015-10-31
    0
  • 《深入浅出统计学》11总体和样本的估计:进行预测

    得样本而知总体,不亦乐乎。通过样本去推知总体,属于推断性统计学。 若要想成为样本专家,首先需要有效地利用样本去准确地预测总体,并以一定方式说明预测结果的可靠程度。 点估计量 样本均值被称为总体均值的点估计量,换而言之,样本均值,作为一个对于所有样本数据的计算结果,它是总体均值的良好估计。 点估计近似总体参数 当总体参数的确切数值无法获知的情况下,我们用“点估…

    2015-07-11
    0
  • 说人话的统计学:你真的懂p值吗?

    有人说:「统计学就是个p!」此p可不像彼「屁」,可以一放了之。

    2015-08-01
    0
关注我们
关注我们
分享本页
返回顶部