统计学
-
检测异常值的参数和非参数方法
摘要:如何利用参数和非参数方法来检测异常值 异常值是指距离其他观测值非常遥远的点,但是我们应该如何度量这个距离的长度呢同时异常值也可以被视为出现概率非常小的观测值,但是这也面临同样的问题——我们要如何度量这个概率的大小呢 有许多用来识别异常值的参数和非参数方法,参数方法需要一些关于变量分布情况的假设条件,而非参数方法并不需要这些假设条件。此外,你还可以利用单…
-
统计学家难得的共识:是时候停止滥用P值了
小小的P值, 对于显著性, 你说想要说些什么 —Stephen Ziliak, 罗斯福大学经济学教授 需要多少个统计学家,才能保证对于p值有至少50%的不满呢根据曼荷莲学院统计学家George Cobb半开玩笑的估计,答案是两个…或者一个。所以也就不令人意外,当美国统计协会聚集了26名专家商讨关于统计显著性和P值的一致声明时,讨论很快就变得激烈。 对于外行人…
-
一名数据分析师走过的路
都说世上没有丑女人只有懒女人,我恰恰就是后者… … 疏于总结自己走过的路做过的事就是我的“懒”体现之一,最近看到不少童靴在各种渠道问各种关于数据分析师的问题,比如“快要毕业了想做数据分析师要如何准备面试”,“现在是做XX工作,换工作时想转行做数据分析师应该补充些什么指示”等等,所以决定摆脱拖延症就从总结自己作为一个数据分析师走过的路开始,各位看官觉得有所收益…
-
数据科学极简史(二)
2002 年 4 月,数据科学期刊(Data Science Journal)创刊,旨在发表「科学与技术领域的数据与数据库管理」方面的论文。「此期刊涵盖对于数据系统的描述,及其在互联网上的发布、应用和法律问题。」此期刊由国际科学理事会(International Council for Science )旗下的数据科学技术委员会(Data for Scien…
-
数据科学极简史(一)
数据科学家如何变得性感的故事,大致也就是作为成熟学科的统计学如何与新兴学科计算机科学发生关系的故事。“数据科学”这个术语的出现较晚近,用来指代一个需要解读大量数据的职业。但解读数据这件事的历史很长,它已经被科学家、统计学家、图书馆员、计算机科学家以及其他人士讨论多年。下文的时间线追溯“数据科学”一词的演化,以及它的应用、对它进行定义的尝试和一些相关的术语。 …
-
让数据和用户服务于你的运营
【摘要】 什么都要靠数据去支撑。比如我们把按钮从左边换到右边,从红色换成黄色。这个东西一定要有什么数据分析团队、数据分析师、产品经理在哪儿反复打磨。最后跟我们说一句,按钮从以前的100像素换到了105像素。这是很无聊的一件事情,但是这个要用数据去验证,你知道吗? 大家好,我是来自萌义网络的干田。 以前我上台的时候,是这样跟大家说的:“大家好,我是干田,干部的…
-
统计学和数据挖掘的异同探讨
1. 简介 统计学和数据挖掘有着共同的目标:发现数据中的结构。事实上,由于它们的目标相似,一些人(尤其是统计学家)认为数据挖掘是统计学的分支。这是一个不切合实际的看法。因为数据挖掘还应用了其它领域的思想、工具和方法,尤其是计算机学科,例如数据库技术和机器学习,而且它所关注的某些领域和统计学家所关注的有很大不同。 统计学和数据挖掘研究目标的重迭自然导致了迷惑。…
-
数据科学的统计学入门
统计学是门严肃的学科,很多人穷尽一生来学习研究它。
-
Mango中国区数据总监:一个数据科学家的这些年
摘要:这篇文章来自于我和肖凯的新作《数据科学中的R语言》的前言。原书受篇幅和语言风格所限,前言经过了一些删减,在这里将全文和增补的内容发布出来。为了尽量避免为新书打广告的嫌疑,先提前声明我们会把书中一些自认为比较有价值的经验和见解发布到统计之都上,只是希望对数据科学和R语言有个基本的认识或者了解一些作者的建议和感悟的读者大可不必去买这本书,只有对具体案例和技…
-
空间数据挖掘认识及其思考
摘 要: 在这个大数据时代,空间数据正在从各个领域飞速累计。空间数据挖掘作为数据挖掘的一部分,现已成为人们研究空间数据的重点学科。主要介绍了空间数据挖掘的基本概念、一般步骤及其最新的挖掘方法,表达了对当前空间数据挖掘的看法。最后对未来空间数据挖掘的研究方向进行了更加深入的探讨。 0 引言 空间数据挖掘(Spatial Data Mining,SDM)即找出开…
-
猎聘网首席数据官单艺:你的客户,价值几何?
摘要:2月23日,GrowingIO公开课邀请猎聘网CDO单艺先生为大家讲解“你的客户,价值几何?”课程,带您一探究竟! 在市场中,每个客户的能给厂家带来的价值并不相同,换言之,客户的价值并不相等。那么如何衡量一个客户(用户)在一段时期内对企业有多大价值?以此来获取、留住优质客户,并针对性促销,提供更精准服务,获得更大商业价值。 1.客户的价值真的都是平等的…
-
Tableau大中国区销售总监Thomas Yap:敏捷的数据分析能力助你在猴年职场旗开得胜
摘要:敏捷的数据分析能力会助你在猴年职场旗开得胜 猴年新年一过,大家都回到了各自的工作中,开始为各自的事业而忙碌。在新一年伊始,大部分人都会重新审视自己的职业生涯,思考如何在新一年的工作中能有所提高,还有许多人会试着寻找职场中的新机遇,迎接全新的挑战。这时,不妨来看看一些职场领域的热门话题,或许对你有所启发。 当我们还在欢度猴年春节的假期时,全球经济形势充满…
-
利用Python,四步掌握机器学习
摘要:为了理解和应用机器学习技术,你需要学习Python或者R。这两者都是与C、Java、PHP相类似的编程语言。但是,因为Python与R都比较年轻,而且更加“远离”CPU,所以它们显得简单一些。相对于R只用于处理数据,使用例如机器学习、统计算法和漂亮的绘图分析数据,Python的优势在于它适用于许多其他的问题。因为Python拥有更广阔的分布(使用Jan…
-
数据挖掘的常用方法、功能和一个聚类分析应用案例
摘要:笔者整理了数据挖掘的常用方法和数据挖掘的重要功能(出自MBA智库百科)。当然,横看成岭侧成峰,这些常用方法和重要功能也许并不完全正确或完整。除此以外,笔者尝试学习了SMARTBI公司中的Smart Mining软件,并跟随其提供的示例教程进行了学习。为方便阅读,将其示例教程结合自己的体会作为文章的第三部分。 一、数据挖掘的常用方法 利用数据挖掘进行数据…