基础准备
结束了描述性统计学部分的内容后,就进入到推断统计学阶段。在这个阶段,主要任务就是交给大家用样本信息推断总体信息的原理及方法。点估计和区间估计,置信度和置信区间是推断性统计学的基础性内容。统计基础请前往下方获取导航页。
概念定义
先定义一些区间估计的概念:
θ:待估计的总体参数;
θL:由样本确定的置信下限;
θU:由样本确定的置信上限;
α:显著性水平,是大于0小于1的数值;
1-α:置信度;
如果由样本确定的两个统计量θL和θU满足P(θL<θ<θU)=1-α,就称随机区间(θL ,θU)是θ的置信度为1-α的置信区间。θL和θU分别称为置信度为1-α的置信下限和置信上限,1-α称为置信度。曾经估计小学生的平均身高是在1.40m和1.50m之间,可靠程度为95%。现在可以用公式将以上的叙述表达出来:
P(1.40<<1.50)=95%;
式中的表示小学生的平均身高。(1.40<<1.50)是置信区间;95%是置信度,1.40m和1.50m分别是置信下限和置信上限。
置信区间的分类
双侧置信区间:上例中的(1.40<<1.50)属于双侧置信区间;
单侧置信区间:在有些场合下,我们只关心总体参数某一侧的界限。例如,对于产品的寿命来说,消费者只关心其寿命的下限,对其上限则希望越长越好;而对于许多成本,则正好相反。
区间估计原理
下面以估计正态总体的均值为例,说明区间估计的原理。
置信度与置信区间的关系
在估计总体参数时,一般都会给出一个较高的置信度,如95%或99%等。但是,当样本容量n一定时,置信度越高,置信区间就越大,也即估计的参数的相对精度就会越低。反之,置信度越低,则精度相对就会越高。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。