统计学
-
样本分布不正态?数据变换来救场!
假如我们的总体分布不怎么正态,样本量也不是很大,感觉用 t 检验好像有点儿够呛,这时该怎么办?
-
统计学界的一件大事:美国统计协会(ASA)正式发布了一条关于P值的声明
(图片来源:https://xkcd.com/1478,一幅讽刺滥用P值的漫画) 今天美国统计协会(ASA)正式发布了一条关于P值的声(吐)明(槽),算起来可以说是近期统计学界的一件大事了。为什么这么说呢?首先,P值的应用太广,所以对P值进行一些解释和声明非常有必要。其次,对P值的吐槽历来有之,但今天是第一次被一个大型的专业协会以非常正式的形式进行澄清,多少…
-
标准正态分布函数的快速计算方法
标准正态分布的分布函数 Φ(x)Φ(x) 可以说是统计计算中非常重要的一个函数,基本上有正态分布的地方都或多或少会用上它。在一些特定的问题中,我们需要大量多次地计算这个函数的取值,比如我经常需要算正态分布与另一个随机变量之和的分布,这时候就需要用到数值积分,而被积函数就包含 Φ(x)Φ(x)。如果 ZN(0,1),Xf(x)ZN(0,1),Xf(x),ff …
-
两样本估计和假设检验范例分析
两样本推断性统计基础:两样本估计和假设检验基础。
-
谢邦昌:统计学中的人生处世法则
摘要:这是谢邦昌先生写的一篇关于统计学与人生的文章,有点意思,谈及统计学与人生处世法则。 他的大致观点如下: 一、平均数———中庸法则 平均数, 是代表一个群体特性的集中趋势。人生一切行为, 应以中庸为法则, 既不可过分自我膨胀, 也不宜过分自我矮化。 认为: 平均数的代表性———不偏不激; 平均数的有效性———执两用中; 中央极限———坚守中庸; 平均数的…
-
检测异常值的参数和非参数方法(续)
摘要:在之前的文章中,我们讨论了如何利用单变量和多变量分析的方法来检测异常值。接下来我们将介绍如何利用聚类方法识别多变量情形中的异常值。 推荐阅读:检测异常值的参数和非参数方法 顾名思义,聚类方法就是将特征相似的样本聚集在同一个类别中,因此样本间的相似性是一个非常重要的概念,我们需要考虑如何量化样本间的相似情况。通常情况下,我们用样本之间的距离远近来衡量其相…
-
检测异常值的参数和非参数方法
摘要:如何利用参数和非参数方法来检测异常值 异常值是指距离其他观测值非常遥远的点,但是我们应该如何度量这个距离的长度呢同时异常值也可以被视为出现概率非常小的观测值,但是这也面临同样的问题——我们要如何度量这个概率的大小呢 有许多用来识别异常值的参数和非参数方法,参数方法需要一些关于变量分布情况的假设条件,而非参数方法并不需要这些假设条件。此外,你还可以利用单…
-
统计学家难得的共识:是时候停止滥用P值了
小小的P值, 对于显著性, 你说想要说些什么 —Stephen Ziliak, 罗斯福大学经济学教授 需要多少个统计学家,才能保证对于p值有至少50%的不满呢根据曼荷莲学院统计学家George Cobb半开玩笑的估计,答案是两个…或者一个。所以也就不令人意外,当美国统计协会聚集了26名专家商讨关于统计显著性和P值的一致声明时,讨论很快就变得激烈。 对于外行人…
-
数据科学的统计学入门
统计学是门严肃的学科,很多人穷尽一生来学习研究它。
-
概率的意义:随机世界与大数法则
导语 1987年,是印度传奇数学家拉曼努扬(SrinivasaRamanujan,1887-1920)的百年诞辰。为了纪念他,有一系列的活动。当代著名统计学者, 出生于印度的劳氏(C. Radhakrishna Rao,1920),也应邀做了三场演讲。之后,印度统计学研究所(IndianStatistical Institute)基于劳氏的演讲稿,于1989…
-
什么是伯努利分布?
伯努利分布是指一个分布离散型概率分布,为纪念瑞士科学家雅各布布?伯努利而命名。
-
什么是不等距分组?
不等距分组又称异距分组,各组组距并不完全相等的分组。它适用于标志值变动很不均匀的情况。
-
什么是标准误差?
什么是标准误差(Standard error),也称均方根误差(Root mean squared error)?
-
什么是标准偏差?
标准偏差(也称标准离差或均方根差)是反映一组测量数据离散程度的统计指标。
-
什么是变量?
变数或变量,是指没有固定的值,可以改变的数。