统计学
-
什么是百分位数?
什么是百分位数(Percentile)?
-
什么是频数分布?
频数也称“次数”,对总数据按某种标准进行分组,统计出各个组内含个体的个数。
-
一秒钟看穿统计陷阱
摘要:正所谓“流氓懂科学,谁也挡不住”。 如今越来越多的复杂统计数据像潮水般向我们涌来,一批又一批的调查结果,都显得那么铿锵有力,似乎那就是客观事实。 统计陷阱被科学流氓们包装的越发完美,一不小心就把我们忽悠了。该怎么办呢别急,且看死理性派现身说法,帮大家理清真相。 抽样调查,想说无偏不容易 调查问卷你肯定知道,多半还做过。在统计上,问卷调查属于抽样调查。再…
-
当文学遭遇数据:《红楼梦》中的统计学错误
摘要:统计学与语言文学的结合上具有开创意义。 开篇不谈《红楼梦》,读尽诗书也枉然,曹公若懂概率论,不让马尔可夫链。 ——国际红学大会未入选论文 俄国著名数学家马尔可夫(1865-1922),在对俄语字母序列的研究中,提出了马尔可夫随机过程,后来扩展成统计学的一个分支,对现代统计学的发展产生了深刻影响。语言结构中所蕴藏着的统计规律,成了马尔可夫创造性思想的源泉…
-
几则趣味的统计小故事,你秒懂了吗?
很多人在学习统计时都认为统计由一系列枯燥的数字、公式和图表组成,十分繁杂无味。然而随着对这门课的深入理解,不知不觉中会逐渐体会到统计的趣味性。这里,挑选几则经典的统计趣味小故事与大家分享,希望大家喜欢。 《红楼梦》作者考证 众所周知,《红楼梦》一书共120回,自从胡适作《红楼梦考证》以来,一般都认为前80回为曹雪芹所写,后40回为高鹗所续。然而长期以来这种看…
-
25年后的统计系会是什么样?
摘要:本文是统计学家Leo Breiman1994年在加州伯克利统计系毕业典礼上的讲话。 Leo Breiman简介:加州伯克利统计系教授,美国国家科学院院士,20世纪伟大的统计学家,囊括多项统计领域大奖。机器学习先驱者,分类回归树作者之一,Bagging方法发明者,对模式识别领域有巨大贡献。于2005年逝世。 很久以前,Peter Bickel 请我做一个…
-
趣味统计学:从A到Z
A-Application (应用) 要懂得应用统计的观念,学统计绝不是仅止于课堂上标准答案的追求,必须能应用在各种状况工作中。 B-Bias (偏误) 运用统计,必须避免偏误,特别是在抽样的时候,因为一旦抽样时就带有偏误,那么后续的统计分析就没有意义了。 C-Correct (正确) 正确使用统计方法,正确解释统计结果;运用统计方法以及解释统计结果时必须正…
-
贝叶斯的定义及核心原理
一、什么是贝叶斯推断 贝叶斯推断(Bayesian inference)是一种统计学方法,用来估计统计量的某种性质。 它是贝叶斯定理(Bayes’ theorem)的应用。英国数学家托马斯·贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理。 贝叶斯推断与其他统计学推断方法截然不同。它建立在主观判断的基础上,也就是…
-
正态分布的前世今生:误差分布曲线的确立
【编者注】几乎所有的经济模型都有假设前提,学过计量经济学的同学都知道古典假设,而正态分布又在假设中占有十分重要的作用,小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章,文章以名人、故事为主线简单的描述了正态分布的前世今生,这里特推荐给大家。 第三个故事有点长,主角是高斯和拉普拉斯,故事的主要内容是猜测上帝的造物的旨意,寻找随机误差分…
-
正态分布的前世今生:最小二乘法
【编者注】几乎所有的经济模型都有假设前提,学过计量经济学的同学都知道古典假设,而正态分布又在假设中占有十分重要的作用,小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章,文章以名人、故事为主线简单的描述了正态分布的前世今生,这里特推荐给大家。 第二个故事的主角是欧拉(Euler), 拉普拉斯(Lapalace),勒让德Legendre…
-
正态分布的前世今生:从高斯说起
【编者注】几乎所有的经济模型都有假设前提,学过计量经济学的同学都知道古典假设,而正态分布又在假设中占有十分重要的作用,小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章,文章以名人、故事为主线简单的描述了正态分布的前世今生,这里特推荐给大家。 神说,要有正态分布,就有了正态分布。 神看正态分布是好的,就让随机误差就服从了正态分布。 创…
-
信息增益的基本概念
当我们需要对一个随机事件的概率分布进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任何主观假设。在这种情况下,概率分布最均匀,预测的风险最小。因为这时概率分布的信息熵最大,所以称之为“最大熵法”。最大熵法在数学形式上很漂亮,但是实现起来比较复杂,但把它运用于金融领域的诱惑也比较大,比如说决定股票涨落的因素可能有几十甚至上百种,而最大熵方法恰…
-
统计学中P值的意义
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。 专业上,P值为结果可信程度的一个递减指标,P值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。 P值是将观察结果认为有效即具有总体代表性的犯错概率。如P=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实…
-
为什么要进行方差齐性检验?
为什么要进行方差齐性检验?来自大家的讨论,数据分析网整理发布。 【楼主】方差齐性检验是方差分析的重要前提,是方差可加性原则应用的一个条件。方差齐性检验是对两样本方差是否相同进行的检验。方差齐性检验和两样本平均数的差异性检验在假设检验的基本思想上是没有什么差异性的。只是所选择的抽样分布不一样。方差齐性检验所选择的抽样分布为F分布。 【沙发】方差分析的一个前提是…
-
假设检验中几个常见的基本概念
1. 假设检验 假设检验就是先对总体的参数或作出某种假设, 然后用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或接受。其结果将有助于研究者作出具,采取措施。 2. 原假设(零假设)焊择假设(对立假设) 原假设:根据检验结果准备予以拒绝或接受的假设,以H0表示;备择假设:与原假设不相容(即对立)的假设,以H1表示。如:对总体随机变量X的均数μ不小于一…