统计基础
-
检测异常值的参数和非参数方法(续)
摘要:在之前的文章中,我们讨论了如何利用单变量和多变量分析的方法来检测异常值。接下来我们将介绍如何利用聚类方法识别多变量情形中的异常值。 推荐阅读:检测异常值的参数和非参数方法 顾名思义,聚类方法就是将特征相似的样本聚集在同一个类别中,因此样本间的相似性是一个非常重要的概念,我们需要考虑如何量化样本间的相似情况。通常情况下,我们用样本之间的距离远近来衡量其相…
-
统计学家难得的共识:是时候停止滥用P值了
小小的P值, 对于显著性, 你说想要说些什么 —Stephen Ziliak, 罗斯福大学经济学教授 需要多少个统计学家,才能保证对于p值有至少50%的不满呢根据曼荷莲学院统计学家George Cobb半开玩笑的估计,答案是两个…或者一个。所以也就不令人意外,当美国统计协会聚集了26名专家商讨关于统计显著性和P值的一致声明时,讨论很快就变得激烈。 对于外行人…
-
概率的意义:随机世界与大数法则
导语 1987年,是印度传奇数学家拉曼努扬(SrinivasaRamanujan,1887-1920)的百年诞辰。为了纪念他,有一系列的活动。当代著名统计学者, 出生于印度的劳氏(C. Radhakrishna Rao,1920),也应邀做了三场演讲。之后,印度统计学研究所(IndianStatistical Institute)基于劳氏的演讲稿,于1989…
-
什么是伯努利分布?
伯努利分布是指一个分布离散型概率分布,为纪念瑞士科学家雅各布布?伯努利而命名。
-
什么是不等距分组?
不等距分组又称异距分组,各组组距并不完全相等的分组。它适用于标志值变动很不均匀的情况。
-
什么是标准误差?
什么是标准误差(Standard error),也称均方根误差(Root mean squared error)?
-
什么是标准偏差?
标准偏差(也称标准离差或均方根差)是反映一组测量数据离散程度的统计指标。
-
什么是变量?
变数或变量,是指没有固定的值,可以改变的数。
-
说人话的统计学 | 贝叶斯vs频率派:武功到底哪家强?
运用之妙,存乎一心,正所谓“无招胜有招”才是最高境界,你说是吗?
-
说人话的统计学:做统计,多少数据才算够?(下)
多少数据才算够?
-
说人话的统计学:做统计,多少数据才算够?(上)
多少数据才算够?
-
说人话的统计学:你真的懂p值吗?
有人说:「统计学就是个p!」此p可不像彼「屁」,可以一放了之。
-
《深入浅出统计学》15相关与回归:我的线条如何?
了解事物之间的相互关系可以丰富你的信息,让你了解真相,使你立于不败之地。 发现事物之间的相互关系:相关与回归。 数据类型探讨 单变量数据考虑的是一个单一变量的频数或者概率。 二变量数据给出两个变量的数值,如果其中一个变量以某种方式受到控制,或者被用来解释另一个变量,则这个变量被称为自变量或者解释变量,另一个变量则称为因变量或者反应变量。 二变量数据可视化 散…
-
《深入浅出统计学》14卡方分布:继续探讨
有时候事实与期望并不相符,我们需要有这个心理准备,同时,我们需要寻求其他方法进行分析和解答。 使用卡方检验评估差异 检验统计量代表什么 拟合优度检验 拟合优度检验——它检验观察频数是否和假设的概率分布相吻合。 自由度确定规律 要点一 总结 1卡方检验的含义 2卡方检验的应用 练习
-
《深入浅出统计学》13 假设检验的运用:研究证据
他人的言论未必句句真实可信。如何判断和定论?其目的就是发现真相,还原本真,呈现可靠。 如何判断他人的言论是真,是假?假设检验是一种思维方法——利用样本检验各种统计断言是否可能属实。通过假设检验可以权衡证据,检验极限结果——是纯属巧合,还是存在其他内在根据。 假设检验具体过程 查看断言 查看证据 做出决策 假设检验的六个步骤 原假设 备选假设 注意:进行假设检…