基础准备
之前已经具体介绍了不同已知条件下用样本均值来估计总体均值的方法:
回顾总体均值的单样本估计,根据不同已知条件,可以对样本的抽样分布运用标准正态变换、t分布或切比雪夫(Chebyshev)不等式进行总体均值的估计。
那如何用样本方差(标准差)估计总体方差(标准差)呢?抽样分布中的卡方分布就是途径之一。
卡方分布
统计量及卡方分布定义
定义:卡方统计量的抽样分布称为卡方分布,如果大小为n的所有可能的样本取自方差为σ2的正态分布总体,且对每一样本计算卡方统计量的特定值,则这些特定值将有一个称作卡方分布的连续概率分布(抽样分布)。卡方分布由一个特定的唯一的概率密度函数所定义,函数为:
概率密度函数曲线如下,随着自由度的增加,曲线变成单峰的,且越来越对称。
卡方分布的临界值
单尾临界值
上面三个不等式都是右侧概率,正态分布和t分布是关于纵轴0对称的,所以,左侧概率就是负的右侧概率;但是从上面的卡方分布概率密度图可以知道,曲线不是关于0对称的(见下图),所以卡方分布的左侧概率为:
双尾临界值
同样的,正态分布和t分布是关于纵轴0对称的,所以,左侧概率就是负的右侧概率;但是卡方分布概率密度曲线不是关于0对称的,所以卡方分布的左侧概率和右侧概率是不同的,如下图:
卡方分布求正态总体方差的置信区间
以双尾为例,进行公式推导讲解。
如果所有容量为n的可能随机样本来自一个无限大的正态分布总体,且对每一样本计算连续随机变量的方差,利用卡方分布即可推导:
例题分析
社会如果你在食品公司就职,要求确定一标准袋薯片的平均“总脂肪”量(单位:克)。现分析了101袋,并得到下列结果:均值为18.2克,方差为0.56克。如果假定一标准袋的总脂肪量是正态分布的,给出总体均值和方差的90%置信区间。
解:因为是正态分布总体且总体方差未知,所以求总体均值可以用t分布精确求解或用标准正态分布近似(请见基础回顾表格);而求总体方差用到卡方分布,具体过程如下:
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。