统计学

统计学

25年后的统计系会是什么样?

摘要：本文是统计学家Leo Breiman1994年在加州伯克利统计系毕业典礼上的讲话。 Leo Breiman简介：加州伯克利统计系教授，美国国家科学院院士，20世纪伟大的统计学家，囊括多项统计领域大奖。机器学习先驱者，分类回归树作者之一，Bagging方法发明者，对模式识别领域有巨大贡献。于20…

大数据精选
2015-12-02
00
统计学

趣味统计学：从A到Z

A－Application　(应用) 要懂得应用统计的观念，学统计绝不是仅止于课堂上标准答案的追求，必须能应用在各种状况工作中。 B－Bias　(偏误) 运用统计，必须避免偏误，特别是在抽样的时候，因为一旦抽样时就带有偏误，那么后续的统计分析就没有意义了。 C－Correct　(正确) 正确使用统计…

小胖
2015-11-29
00
统计学

贝叶斯的定义及核心原理

一、什么是贝叶斯推断贝叶斯推断（Bayesian inference）是一种统计学方法，用来估计统计量的某种性质。它是贝叶斯定理（Bayes’ theorem）的应用。英国数学家托马斯·贝叶斯（Thomas Bayes）在1763年发表的一篇论文中，首先提出了这个定理。贝叶斯推断与…

大数据精选
2015-11-21
01
统计学

正态分布的前世今生：误差分布曲线的确立

【编者注】几乎所有的经济模型都有假设前提，学过计量经济学的同学都知道古典假设，而正态分布又在假设中占有十分重要的作用，小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章，文章以名人、故事为主线简单的描述了正态分布的前世今生，这里特推荐给大家。第三个故事有点长，主角是高斯和拉…

小胖
2015-11-21
00
统计学

正态分布的前世今生：最小二乘法

【编者注】几乎所有的经济模型都有假设前提，学过计量经济学的同学都知道古典假设，而正态分布又在假设中占有十分重要的作用，小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章，文章以名人、故事为主线简单的描述了正态分布的前世今生，这里特推荐给大家。第二个故事的主角是欧拉(Eule…

张乐
2015-11-21
00
统计学

正态分布的前世今生:从高斯说起

【编者注】几乎所有的经济模型都有假设前提，学过计量经济学的同学都知道古典假设，而正态分布又在假设中占有十分重要的作用，小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章，文章以名人、故事为主线简单的描述了正态分布的前世今生，这里特推荐给大家。神说，要有正态分布，就有了正态分…

小胖
2015-11-21
00
统计学

信息增益的基本概念

当我们需要对一个随机事件的概率分布进行预测时，我们的预测应当满足全部已知的条件，而对未知的情况不要做任何主观假设。在这种情况下，概率分布最均匀，预测的风险最小。因为这时概率分布的信息熵最大，所以称之为“最大熵法”。最大熵法在数学形式上很漂亮，但是实现起来比较复杂，但把它运用于金融领域的诱惑也比较大，…

小胖
2015-11-21
01
统计学

统计学中P值的意义

结果的统计学意义是结果真实程度（能够代表总体）的一种估计方法。专业上，P值为结果可信程度的一个递减指标，P值越大，我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。 P值是将观察结果认为有效即具有总体代表性的犯错概率。如P=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设…

小胖
2015-11-21
01
统计学

为什么要进行方差齐性检验？

为什么要进行方差齐性检验？来自大家的讨论，数据分析网整理发布。【楼主】方差齐性检验是方差分析的重要前提，是方差可加性原则应用的一个条件。方差齐性检验是对两样本方差是否相同进行的检验。方差齐性检验和两样本平均数的差异性检验在假设检验的基本思想上是没有什么差异性的。只是所选择的抽样分布不一样。方差齐性…

小胖
2015-11-21
01
统计学

假设检验中几个常见的基本概念

1. 假设检验假设检验就是先对总体的参数或作出某种假设, 然后用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或接受。其结果将有助于研究者作出具,采取措施。 2. 原假设(零假设)焊择假设(对立假设) 原假设:根据检验结果准备予以拒绝或接受的假设,以H0表示;备择假设:与原假设不相容(即对…

小胖
2015-11-21
00
统计学

统计学理论中常说的四种错误

统计学上的四型错误 Ⅰ型错误：也称假阳性错误即当原假设H0客观上成立, 但根据假设检验的规则,将有α大小的概率错误地拒绝H0,同时错误地接受备择假设H1。 Ⅱ型错误：也称假阴性错误即当H0客观上不成立,但根据假设检验的规则, 将有β大小的概率错误地拒绝H1,同时错误地接受H0。 Ⅲ型错误：即最终…

小胖
2015-11-21
00
统计学

主成分分析方法概念和基本性质

科学研究所涉及的课题往往比较复杂，是因为影响客观事物的因素多，需要考察的变量多。比如说，对于糖尿病、动脉硬化等疾病，其病因是多种多样的，收集的资料中包含的信息是丰富多彩的。然而，重叠的、低质量的信息越多，越不利于医生作出诊断。在大部分实际问题中，变量之间是有一定的相关性的，人们自然希望找到较少的几个…

小胖
2015-11-21
00
统计学

“小数据”的统计学

一、小数据来自哪里科技公司的数据科学、关联性分析以及机器学习等方面的活动大多围绕着”大数据”，这些大型数据集包含文档、用户、文件、查询、歌曲、图片等信息，规模数以千计，数十万、数百万、甚至数十亿。过去十年里，处理这类型数据集的基础设施、工具和算法发展得非常迅速，并且得到了不断改善。…

大数据精选
2015-11-15
00
统计学

为什么说统计学依然是数据分析灵魂

什么样的数据才算大数据，怎样才能用好大数据，传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立，著名统计学家、哈佛大学终身教授刘军担任主任。

大数据精选
2015-11-04
00
统计学

几个发人深省的统计小故事

在魔鬼经济学等数据科普读物中，常常会有很多反常识的小故事，或许这些反常识正是数据分析（统计）的价值所在，本篇中国统计网推荐大家看借个小故事。问：统计资料表明．大多数汽车事故出在中等速度的行驶中，极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全？答：绝不是这样。统计…

小胖
2015-11-03
01

文章分类

统计学