基础准备
两样本参数估计:两样本估计和假设检验基础;
两样本假设检验:两样本估计和假设检验范例分析;
成对样本假设检验:成对样本两个总体均值差的假设检验;
根据两个样本之间的关系,可以划分为独立样本和成对样本(两样本估计和假设检验基础),它们的区间估计方法是不同的,成对样本的区间估计和假设检验请回顾:成对样本两个总体均值差的假设检验);如果是从两个互相之间没有影响的样本中得到的数据,称之为来自独立样本。下面介绍来自两个独立样本的均值之差的区间估计。
对两个总体均值差异的检验,在实践中有许多应用。例如,要确定两个城市收入水平是否有明显不同;要分析男、女消费者平均购物支出是否有差别;需要判断医生与律师哪一种职业收入更高;想研究两种购物环境下,顾客的停留时间是否一致等。这些研究都可归于两个总体均值之差的检验问题。
两总体均值差假设检验
σ1,σ2已知的正态总体,独立样本
如果X1~N(1,σ12),X2~N(2,σ22)且σ1,σ2已知。n1,n2是来自两个独立样本的样本容量,则根据下面公式,可以构造Z统计量,得:
如果研究的问题是两个总体均值是否有差异,则可建立如下双侧假设:
H0:1=2;H1:1≠2
上述假设也可以记为:
H0:1–2=0;H1:1–2≠0
如果在研究中要检验一个总体均值是否大于(或小于)另一总体的均值,这时就应进行单侧检验,记为:
H0:1–2=0; H1:1–2>0
H0:1–2=0;H1:1–2<0
范例分析
例1:有甲、乙两条生产线同时罐装产品,已知两条生产线产品的质量都服从正态分布。甲(总体1)X1~N(1,0.32),乙(总体2)X2~N(2,0.42)。现分别从甲、乙两条生产线上随机抽10件和8件产品,测得它们的平均质量为249.4g和250.2g。问甲、乙链条生产线罐装产品的质量是否有明显差异。(α=0.05)
解:本例是关于两总体均值是否有差异的双侧检验问题。
设H0:1=2;H1:1≠2
根据上述已知条件总体1方差为0.32,总体2方差为0.42,样本1容量为10,样本2容量为8,总体1的样本均值249.4g,总体2的样本均值250.2g。可选取统计量Z,得:
已知α=0.05,为双侧检验。查正态分布表,临界值为±Z0.05/2=±1.96。因为Z=-4.70<-1.96=-Z0.05/2,统计量落在拒绝域内,所以拒绝原假设,接受备择假设,即甲和乙两条流水线罐装产品的质量存在显著的差异。
σ1,σ2未知,假定σ1=σ2,两样本容量小于30
前面介绍过(回顾:不同条件的总体均值单样本估计方法总述),对于正态总体,标准差未知的情况,需要用到t分布进行均值的区间估计和假设检验,这是对于单样本而言的;对于两正态总体,标准差未知,当σ1=σ2时,可以将两总体均值差的问题转化为单个总体均值区间估计和假设检验的问题了,此情况的公式推导请回顾:两样本估计和假设检验范例分析。根据上述条件,应该用t统计量,由下面公式:
σ1,σ2未知且不相等,两样本容量小于30
与上述情况稍有不同,当两正态总体标准差不等时,如何进行区间估计和假设检验呢?同样是运用t分布,不同的是自由度不再是n1+n2-2,而是由下式计算得到得自由度对应的t值来进行区间估计和假设检验。
范例分析
例2:某灯饰厂声称该厂声称的新型节能灯的平均寿命比老型节能灯的寿命更长。现随机从新、老两种节能灯中各抽取15只进行检测。新型(设为总体1)的检测结果是X1=5306h,S1=150h;老型(设为总体2)的检测结果是X2=5200h,S2=120h。已知节能灯的寿命服从正态分布。问在α=0.05的显著性水平下,上述样本数据能否证明灯饰厂说法。
解:本例是关于两个总体均值差异的单侧检验问题。对灯饰厂声称的1>2就是要检验的问题,所以将1>2设为备择假设,有
H0:1–2=0; H1:1–2>0
由题中知,n1=n2=15是小样本,总体服从正态分布。因为σ1,σ2未知,且是否相等不知,所以应使用的统计量为
因为α=0.05,是右侧检验,统计量的t的自由度有下式算出
查t分布表,得到临界值t0.05(27)=1.703。因为t=2.137>1.703=t0.05(27)落在拒绝域,所以拒绝原假设,接受备择假设,即可以认为灯饰厂关于新型节能灯寿命更长的说法是可信的。
n1≥30且n2≥30的任何总体
在大样本情况下,根据中心极限定理可知,两总体均值差的抽样分布是以正态分布为极限的,所以可不考虑总体的分布形态,构造统计量
在上式中,如果σ1,σ2未知,可分别用样本均值S1和S2代替。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。