推断性统计学
大多数研究的目的是取得有关总体的一般真实情况。然而由于难以得到整个总体,所以需要从总体中抽取一个样本,然后运用统计方法,从样本信息推断关于总体某些特征的结论。为了使推断合理,样本必须在抽样设计的严格条件下抽取。
抽样设计
从总体中抽取合适样本的方法,使得由样本到总体的推断是合理的,这一过程称为抽样设计,即对一个存在的测量总体,制定一种从中抽取测量样本的方法。
抽取样本方法必须满足两个条件:
(1) 独立性:从总体中抽取一个元素不影响其他任何元素的抽取概率。
(2) 随机性:每一次选取,总体中的所有元素(抽样单位)都有相同的被选概率。
根据自然总体划分,有以下三种情况:
1、对无限大总体的抽样是理想的抽样情形,满足上述条件,因为(1)总体分布抽样过程中保持不变,无论抽样是有放回还是无放回。(2)从这个不变总体中每次抽样时,总体的每一元素有相同的被取概率。(3)总体中元素的所有可能组合有相同的被取概率。(4)总体中所有元素有相同且相互独立的被取概率。
2、从有限总体有放回的抽样可以看做是从无限总体抽样。因为在各次选取中元素被放回,总体分布保持不变。从而可以认为满足上述所有来自无限总体的抽样条件。
3、从有限总体无放回抽样,违反了独立性条件,因为取走一个元素改变了所有剩余元素的被取概率。但是,如果有限总体的容量N相对于样本容量n较大(n≤5%N),则可认为这种违背不构成问题,否则,违反独立性条件。
四种抽样设计
简单随机抽样设计:就是使总体中所有抽样单元都有相等的概率被抽取到样本中去的一种抽样方法。
分层随机抽样设计:如果总体包含一些不重叠的互斥部分(称为层),这是由年龄、性别、种族或地理位置等因子引起的,如果这样的层存在,那么分层随机抽样设计从每一层抽取样本。这样获得的样本比简单随机抽样获得的样本更具有代表性,使推断更有效。若每一层的随机样本容量在样本中所占的比例与该层元素在总体中所占的比例相等,称为比例分层随机抽样,否则,称为非比例分层随机抽样。
系统随机抽样设计:如果抽样框架非常大,通常采用系统随机抽样。在系统随机抽样中,抽样框架中每隔k个元素都被选为样本元素,而第一个被抽取元素(称为初始元素)是从前k个元素中随机选择的。如果在抽样框架中存在明显的周期性或循环,应避免使用系统随机抽样。
整群随机抽样设计:如果一个总体很大且非常分散,那么整群随机抽样的抽样成本较低。将总体元素划分为若干互斥部分(称为群),每部分尽可能是异质的。整群随机抽样可以分为:单阶段整群随机抽样,两阶段整群随机抽样和多阶段整群随机抽样,区别是两阶段整群随机抽样是对单阶段整群随机抽样抽出的群再进行整群随机抽样,以此类推。例如,对国家进行民意调查,每一个省是异质的,可以看做抽样中的一个群,若进行单阶段整群随机抽样,则随机抽取若干个省,省内的每一个人都作为样本,若是两阶段整群随机抽样,则在抽取的省中再随机抽取若干个市,以此类推。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。