小白学统计（50）假设检验时，样本容量的确定

如果统计量的数值落在接受域内，则作出的结论可能犯“取伪”错误，而且犯“取伪”错误的概率β是不可知的。但是，在实践中，有些决策既需要控制犯“弃真”错误的概率α，也需要控制犯“取伪”错误的概率β。在这种情况下，可以通过样本容量的改变来满足这种要求。

例如，我们假设

H₀:μ=μ₀;H₁:μ>μ₀

如果σ已知，n为大样本（或正态总体），则可以确定

上式即为在α和β都确定后的样本容量计算公式。在使用上式时还需注意，当假设为H₀:μ=μ₀; H₁:μ<μ₀时，上式中的分母为(₀－₁)²，其值与(₁－₀)²相等，因此n不变。当假设为H₀:μ=μ₀; H₁:μ≠μ₀时，公式中的Z_α用Z_α/2代替。

下面我们通过一个例题来说明n的确定方法。

例题：有人说某学院学生平均每天的锻炼时间至少30min。随机在该学院中选取100名学生，他们每天平均的锻炼时间为31min，已知学生锻炼时间的标准差为12min。试在α＝0.05的显著性水平下，检验该人的说法是否可信。

解:本例是对总体均值的单侧检验问题。

根据题意假设

H₀:μ=30; H₁:μ>30。

已知n＝100为大样本，样本均值为31min，标准差为12min，根据上式可以构造统计量，即

查标准正态分布表得Z_0.05＝1.64。所以Z＝0.833落在接受域内。即接受原假设，拒绝备择假设，此人的说法不可信。

上面这个例子中的结论有可能犯“取伪”错误，即真实的运动时间已经超过了30min，但却没有得到证明。现在我们来重新对上例进行检验。仍然假设H₀:μ=30; H₁:μ>30，给定α＝0.05。β也可同时给出，但β是与真实的总体的均值联系在一起的。因此当我们无法知道真实的总体均值时，可以逐一假设真实总体均值，从而得出不同的β值。在本例中，先假设真实总体的均值μ₁＝33min。首先有公式计算：

由标准正态分布表中可查到临界点0.86到0点的概率为0.3051.所以由-0.86到－∞的概率为β＝0.5－0.3051＝0.1949。

依此类推，可以通过计算得到在不同假设真值μ条件下的β值。如下表所示：

μ值	z值	β	1－β
30.1	1.556	0.9406	0.0594
31	0.8066	0.791	0.209
32	-0.03	0.488	0.512
33	-0.86	0.1949	0.8051
34	-1.693	0.0455	0.9545
35	-2.526	0.0057	0.9943

上表中的1－β表示原假设不真时，被拒绝的概率；1－β也称为功效函数。可以看到，当μ值离30很近时，1－β值很小，并且以原假设的30为极限；当μ离30较远时，1－β值逐渐增加。这就是说，如果真实的μ值离原假设的30相距不远时，犯“取伪”的错误的可能性是很大的；反之，相距较远时，则犯“取伪”的错误的可能性就很小。本例中当μ₁＝35时，β＝0.0057，即取伪的错误概率只有0.57%，几乎不可能发生。

根据给定α以及确定样本容量n以后，就可以知道在不同真实总体均值的情况下，β值的大小。在上表中，当μ₁＝33时，β＝0.1949。但如果在检验中，我们希望μ₁＝33时，犯“取伪”错误的概率β＝0.1，而不是0.1949。就是说在检验时，如果学生锻炼时间是33min，那么检验者只想冒β＝0.1的风险接受H₀为假时的假设，而不是β＝0.1949。对此，只能通过调整样本容量来完成。如检验前确定α＝0.05，μ₁＝33时，β＝0.1，则根据公式计算n，即