大样本(n≥30)条件下的区间估计
当样本容量为大样本时,根据中心极限定理,样本均值`X的抽样分布以正态分布为极限,此时可以不用考虑通体的分布形式。估计时,根据总体标准差σ是否已知分为两种形式:
1、 总体标准差σ已知,的置信度为1-α的置信区间为
`X-Zα/2*σ/n<<`X+Zα/2*σ/n
2、 总体标准差σ未知,的置信度为1-α的置信区间为
`X-Zα/2*S/n<<`X+Zα/2*S/n
在有限总体中进行抽样时,如果是非重复抽样,要使用有限修正因子来修正估计平均误差。如果考虑修正因子,则上面的置信区间改写为
`X-Zα/2*σ/n*(N-n)/(N-1)<<`X+Zα/2*σ/n*(N-n)/(N-1)
`X-Zα/2*S/n*(N-n)/(N-1)<<`X+Zα/2*S/n*(N-n)/(N-1)
大家在以后的使用中,需要根据给定条件来确定是否需要修正。
例1:
某大学从某一学院中随机抽取学生100人,得知他们平均每天用于体育锻炼的时间为26min。根据以往的数据知道,该学院大学生每天体育锻炼时间的标准差为12min。试求该学院大学生平均每天体育锻炼时间的置信区间,置信度为95.45%。
解:由题中可知:`X=26,n=100,σ=12,由1-α=95.45%,得α=0.0455。该学院虽为有限总体,但N未知,可看为无穷大,故不用考虑修正因子。查表得
Zα/2=Z0.0455/2=2,则的置信区间为
`X-Zα/2*S/n<<`X+Zα/2*S/n = (26-2*12/100,26+2*12/100) = (23.6, 28.4)
可以解释为:有95.45%的可靠程度,估计该学院大学生平均每天体育锻炼的时间在23.6~28.4min之间。
例2:
在例1中,如果已知该学院全部学生为1800人,其它已知条件同例1。试求该学院学生平均每天体育锻炼时间的置信区间。
解:与例1不同的是,总体单位N=1800已知,且n/N=0.056>0.05,因此需要用有限修正因子修正,则的置信区间为
`X-Zα/2*σ/n*(N-n)/(N-1)<<`X+Zα/2*σ/n*(N-n)/(N-1) = (26-2*12/100*(1800-100)/(1800-1), 26+2*12/100*(1800-100)/(1800-1)) = (23.7, 28.3)
可以解释为:有95.45%的可靠程度,估计该学院大学生平均每天体育锻炼的时间在23.7~28.3min之间。
从例1和例2估计的平均每天锻炼时间的结果做比较,可以看出,在同样的条件下,使用修正因子,可以提高估计的精度。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。