统计学

统计学

检测异常值的参数和非参数方法（续）

摘要：在之前的文章中，我们讨论了如何利用单变量和多变量分析的方法来检测异常值。接下来我们将介绍如何利用聚类方法识别多变量情形中的异常值。推荐阅读：检测异常值的参数和非参数方法顾名思义，聚类方法就是将特征相似的样本聚集在同一个类别中，因此样本间的相似性是一个非常重要的概念，我们需要考虑如何量化样本…

数据工匠
2016-04-07
00
统计学

检测异常值的参数和非参数方法

摘要：如何利用参数和非参数方法来检测异常值异常值是指距离其他观测值非常遥远的点，但是我们应该如何度量这个距离的长度呢同时异常值也可以被视为出现概率非常小的观测值，但是这也面临同样的问题——我们要如何度量这个概率的大小呢有许多用来识别异常值的参数和非参数方法，参数方法需要一些关于变量分布情况的假设…

数据工匠
2016-04-04
00
统计学

统计学家难得的共识：是时候停止滥用P值了

小小的P值，对于显著性，你说想要说些什么 —Stephen Ziliak, 罗斯福大学经济学教授需要多少个统计学家，才能保证对于p值有至少50%的不满呢根据曼荷莲学院统计学家George Cobb半开玩笑的估计，答案是两个…或者一个。所以也就不令人意外，当美国统计协会聚集了26名专家商讨关于统…

数据工匠
2016-03-14
00
统计学

数据科学的统计学入门

统计学是门严肃的学科，很多人穷尽一生来学习研究它。

张乐
2016-03-03
01
统计学

概率的意义：随机世界与大数法则

导语 1987年，是印度传奇数学家拉曼努扬(SrinivasaRamanujan，1887-1920)的百年诞辰。为了纪念他，有一系列的活动。当代著名统计学者，出生于印度的劳氏(C. Radhakrishna Rao，1920)，也应邀做了三场演讲。之后，印度统计学研究所(IndianStatis…

张乐
2016-02-19
00
统计学

什么是伯努利分布？

伯努利分布是指一个分布离散型概率分布，为纪念瑞士科学家雅各布布?伯努利而命名。

数据小博士
2016-01-06
00
统计学

什么是不等距分组？

不等距分组又称异距分组，各组组距并不完全相等的分组。它适用于标志值变动很不均匀的情况。

数据小博士
2016-01-05
00
统计学

什么是标准误差？

什么是标准误差（Standard error），也称均方根误差（Root mean squared error）？

数据小博士
2016-01-04
01
统计学

什么是标准偏差？

标准偏差（也称标准离差或均方根差）是反映一组测量数据离散程度的统计指标。

数据小博士
2016-01-03
01
统计学

什么是变量？

变数或变量，是指没有固定的值，可以改变的数。

数据小博士
2016-01-01
00
统计学

什么是百分位数？

什么是百分位数（Percentile）？

数据小博士
2016-01-01
00
统计学

什么是频数分布？

频数也称“次数”，对总数据按某种标准进行分组，统计出各个组内含个体的个数。

数据小博士
2016-01-01
00
统计学

一秒钟看穿统计陷阱

摘要：正所谓“流氓懂科学，谁也挡不住”。如今越来越多的复杂统计数据像潮水般向我们涌来，一批又一批的调查结果，都显得那么铿锵有力，似乎那就是客观事实。统计陷阱被科学流氓们包装的越发完美，一不小心就把我们忽悠了。该怎么办呢别急，且看死理性派现身说法，帮大家理清真相。抽样调查，想说无偏不容易调查问…

大数据精选
2015-12-29
13
统计学

当文学遭遇数据：《红楼梦》中的统计学错误

摘要：统计学与语言文学的结合上具有开创意义。开篇不谈《红楼梦》，读尽诗书也枉然，曹公若懂概率论，不让马尔可夫链。 ——国际红学大会未入选论文俄国著名数学家马尔可夫(1865-1922)，在对俄语字母序列的研究中，提出了马尔可夫随机过程，后来扩展成统计学的一个分支，对现代统计学的发展产生了深刻影响…

小胖
2015-12-26
00
统计学

几则趣味的统计小故事，你秒懂了吗？

很多人在学习统计时都认为统计由一系列枯燥的数字、公式和图表组成，十分繁杂无味。然而随着对这门课的深入理解，不知不觉中会逐渐体会到统计的趣味性。这里，挑选几则经典的统计趣味小故事与大家分享，希望大家喜欢。《红楼梦》作者考证众所周知，《红楼梦》一书共120回，自从胡适作《红楼梦考证》以来，一般都认为…

生活统计学
2015-12-21
04

意见反馈

意见反馈

返回顶部