应用背景
在总体分布未知(或非正态)且样本容量小于30时,均值的抽样分布是未知的,这时我们就不能运用中心极限定理、t分布和大样本理论来估计总体的均值,此时,可以运用切比雪夫(Chebyshev)定理来近似估计总体均值。
回顾总体均值估计方法表:
Chebyshev定理:给定一组数据x1,x2,…,xn,其均值假定为μ,标准差σ>0,则对任意k≥1,位于区间[μ-kσ,μ+kσ]内的数据所占比例大于等于1-1/k2。
切比雪夫定理解释:对于给定的总体,位于区间[μ-kσ,μ+kσ]内的总体比例至少为1-1/k2(即曲线下的阴影面积),这是总体比例的下限,明显的,位于区间[μ-kσ,μ+kσ]内的比例大于1-1/k2,所以这个定理也称为切比雪夫不等式,如下图所示:
总体均值的置信区间:切比雪夫不等式应用
从上表中可以知道,来自非正态总体的小样本(N≤30)均值的抽样分布和t分布都不适用,这里可以用切比雪夫不等式来对总体均值进行估计,推断过程如下:
推断依据回顾
均值无偏估计:小白学统计(27)抽样分布:详述均值的抽样分布及中心极限定理
方差无偏估计:小白学统计(5)——数据离散程度描述
例题分析
一种新的心脏手术正在一家医院推广,对于已完成的20例这种手术,平均住院期为14.3天,标准差为2.84天,因为手术复杂,住院期天数的总体不服从正态分布,而是有些正偏,总体标准差未知,求总体均值的90%近似置信区间。
如果可以假设该总体是正态的,即能够使用t分布方法,则可以得到有更高精度的精确90%置信区间:
对比用切比雪夫不等式和t分布的结果,可以说明前者是对总体均值的近似,后者是对总体均值的精确。(见总体均值估计方法表)
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。