问题
样本来自由“成功”和“失败”组成的群体。根据样本数据,要判断群体中“成功”的比例的置信区间。
解决方案
使用prop.test函数。假设样本数量是n,样本中有n个“成功”:
代码
> prop.test(n, x)
函数的输出中包含有p的置信区间。
讨论
我订阅了一份总体上来说还不错的股市新闻邮件,期中有一个栏目是推荐可能上涨的股票。他们寻找具有特定股价模式的股票并做出推荐。例如,最近该栏目就说某支股票的行情符合该模式。同时还介绍说,最近6次出现该行情模式时,有6次股价上涨。该作者得出结果,这支股票再次上涨的概率是6/9,即66.7%。。
用prop.test,我们可以计算出符合该模式的股票真正上涨的置信区间。这里观察的次数是n=9,成功的次数是x=6。下面输出了95%置信水平的置信区间是(0.309, 0.910):
代码
> prop.test(6, 9)
1-sample proportions test with continuity correction
data: 6 out of 9, null probability 0.5
X-squared = 0.4444, df = 1, p-value = 0.505
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.3091761 0.9095817
sample estimates:
p
0.6666667
这个作者说上涨的概率是66.7%是不明智的。这可能会让他们的读者陷入麻烦。
默认情况下,prop.test会计算置信水平为95%的置信区间。通过conf.level参数可以调整置信水平,例如:
代码
> prop.test(n, x, p, conf.level=0.99)
# 99% confidence level
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。