统计学
-
统计错误让美国人更孤独
60 年前,只有9%的美国人独自一人居住,现在这一数字是28%,比爸爸妈妈跟孩子一起住的这种家庭数量还多。
-
用数据说谎:统计学中几个常见的“错进错出”案例
人们常说“用数据说谎”,我要说往往数据的分析是没问题的,但这些分析却是建立在夸大或不实的数据之上。下面便是几个常见的“错进错出”案例。
-
大数据与统计新思维
在计算机科学、电子商务等领域已率先在大数据技术开发与应用方面做出不俗成就的时候,以数据为研究对象的统计学该如何应对?
-
衡量统计真实性的“黄金标准”P值,并非想象的那样可靠
衡量统计真实性的“黄金标准”——P值,并非众多科学家想象的那样可靠。
-
什么是泊松分布?
什么是泊松分布(Poisson Distribution),是一种统计与概率学里常见到的离散机率分布(discrete probability distribution),由法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年时发表。
-
什么是贝叶斯法则?
贝叶斯法则(Bayes’theorem/Bayes theorem/Bayesian law),又被称为贝叶斯定理、贝叶斯规则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。
-
什么是参数估计?
参数估计(Parameter Estimation),是指用样本指标(称为统计量)估计总体指标(称为参数)。用样本均数估计总体均数以及用样本率估计总体率。
-
傅一平:数据说谎的艺术
大数据时代,数据被称为新时期的石油,但与石油又不同,其价值的体现很大程度依赖于人的解释,虽然数据本身不会说谎,但这给数据说谎提供了操作空间,具备数据甄别能力对于你更真实的去理解数据大有好处。
-
好看的统计图都是相似的,难看的统计图各有各的丑
不讲炫酷的、高大上的统计图,而是给大家分享如何画好最基础的统计图。
-
美国统计学研究方向与国内有什么区别?
美国统计学研究方向有哪些?与国内有何区别?
-
t检验用不了?别慌,还有神奇的非参数检验
当数据不符合正态分布时,除转化为正态分布检验外,还可运用非参数检验的方法。
-
用主成分法解决多重共线性问题
一、多重共线性的表现 线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系。看似相互独立的指标本质上是相同的,是可以相互代替的,但是完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。 二、多重共线性的后果1.理论后果 多重共线性是因为变量之间的相关程度比较高。 按布兰查德认为, 在计量经济学中, 多重共线性实质上是一个“微数…
-
量化研究影响用户使用红包的因素
摘要:由于本人论文还没发布,不变透露,因此具体内容都引用自苏帆帆. 移动阅读业务持续使用行为影响因素研究[D]. 北京邮电大学, 2011. 量化–发问卷 作者最近刚完成了毕业论文初稿,做的课题是关于电子红包的用户研究,研究影响用户使用红包的因素。整个采用了问卷调查+实证研究的模式,简单点来说就是发量表型问卷后分析数据,进行一些探索性或者验证性的…
-
数据变换的万能钥匙:Box-Cox变换
至于说什么时候应该用哪个函数来作变换,原文也针对常见的几种情况给出了一些建议。当然,我们会遇到的数据纷繁复杂,究竟用什么函数效果比较好,还是得通过反复尝试并实际验证才知道。
-
什么是坏数据,它有何副作用?
品觉导读: 很多机构难以获得准确的数据来支撑他们的日常决策。原因就是坏数据。坏数据也称脏数据,是指错误的、具有误导性的、格式非法的信息。 但凡任何一间数据仓库,势必存在着某种形式的坏数据。完全避免坏数据的产生几乎是不可能的,但数据管理可以很好地帮你保持数据的干净。 原文翻译: 信息和数据是一家机构最具战略意义的资产。数据仓库研究所(The Data Ware…