超几何分布是统计学上一种重要的离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数(不归还)。
例如:在有N个样本,其中m个是不合格的。超几何分布描述了在该N个样本中抽出n个,其中k个是不合格的的概率:
或者
上式可如此理解:Cmk表示所有在N个样本中抽出n个的方法数目。CNn表示在m个不合格样本中,抽出k个的方法数目。C(N-m)(n-k)表示剩下来的样本N-m都是及格的,从中抽取出n-k个的方法数目。
若n=1,即从N个样品中抽取一件,恰好抽到不合格样品的概率,此时,超几何分布可以还原为伯努利分布。(伯努利分布内容请见文章——离散型随机变量)
若N无穷大,归还和不归还对于样品整体的不合格样品率没有影响,此时,超几何分布可视为二项分布,在实际应用时,只要N>=10n(取样数小于样本总体数的十分之一),就可用二项分布近似描述不合格品个数。(二项分布内容请见文章——二项分布)
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。