统计学
-
Mango中国区数据总监:一个数据科学家的这些年
摘要:这篇文章来自于我和肖凯的新作《数据科学中的R语言》的前言。原书受篇幅和语言风格所限,前言经过了一些删减,在这里将全文和增补的内容发布出来。为了尽量避免为新书打广告的嫌疑,先提前声明我们会把书中一些自认为比较有价值的经验和见解发布到统计之都上,只是希望对数据科学和R语言有个基本的认识或者了解一些作者的建议和感悟的读者大可不必去买这本书,只有对具体案例和技…
-
空间数据挖掘认识及其思考
摘 要: 在这个大数据时代,空间数据正在从各个领域飞速累计。空间数据挖掘作为数据挖掘的一部分,现已成为人们研究空间数据的重点学科。主要介绍了空间数据挖掘的基本概念、一般步骤及其最新的挖掘方法,表达了对当前空间数据挖掘的看法。最后对未来空间数据挖掘的研究方向进行了更加深入的探讨。 0 引言 空间数据挖掘(Spatial Data Mining,SDM)即找出开…
-
猎聘网首席数据官单艺:你的客户,价值几何?
摘要:2月23日,GrowingIO公开课邀请猎聘网CDO单艺先生为大家讲解“你的客户,价值几何?”课程,带您一探究竟! 在市场中,每个客户的能给厂家带来的价值并不相同,换言之,客户的价值并不相等。那么如何衡量一个客户(用户)在一段时期内对企业有多大价值?以此来获取、留住优质客户,并针对性促销,提供更精准服务,获得更大商业价值。 1.客户的价值真的都是平等的…
-
Tableau大中国区销售总监Thomas Yap:敏捷的数据分析能力助你在猴年职场旗开得胜
摘要:敏捷的数据分析能力会助你在猴年职场旗开得胜 猴年新年一过,大家都回到了各自的工作中,开始为各自的事业而忙碌。在新一年伊始,大部分人都会重新审视自己的职业生涯,思考如何在新一年的工作中能有所提高,还有许多人会试着寻找职场中的新机遇,迎接全新的挑战。这时,不妨来看看一些职场领域的热门话题,或许对你有所启发。 当我们还在欢度猴年春节的假期时,全球经济形势充满…
-
利用Python,四步掌握机器学习
摘要:为了理解和应用机器学习技术,你需要学习Python或者R。这两者都是与C、Java、PHP相类似的编程语言。但是,因为Python与R都比较年轻,而且更加“远离”CPU,所以它们显得简单一些。相对于R只用于处理数据,使用例如机器学习、统计算法和漂亮的绘图分析数据,Python的优势在于它适用于许多其他的问题。因为Python拥有更广阔的分布(使用Jan…
-
数据挖掘的常用方法、功能和一个聚类分析应用案例
摘要:笔者整理了数据挖掘的常用方法和数据挖掘的重要功能(出自MBA智库百科)。当然,横看成岭侧成峰,这些常用方法和重要功能也许并不完全正确或完整。除此以外,笔者尝试学习了SMARTBI公司中的Smart Mining软件,并跟随其提供的示例教程进行了学习。为方便阅读,将其示例教程结合自己的体会作为文章的第三部分。 一、数据挖掘的常用方法 利用数据挖掘进行数据…
-
博而不精——不要盲信数据,用户多的不一定好
摘要:作者为新型内容发布平台 Medium 首席执行官 Evan Williams。本文介绍了作者对于互联网公司价值该如何衡量与评判的独特看法。 最近有人引用我的文章说:“我才不在乎 Instagram 的用户是不是比 Twitter 要多呢!” 如果你确实读过我写的那篇文章,你会发现我说那句话是有个大前提的,原文如下: 如果你想想 Twitter 和 In…
-
统计数据会撒谎?95%海外观众对春晚满意
昨晚我的微博微信被这条新闻刷屏了《95%海外观众对央视春晚满意》,每条消息下面都是大量的评论吐槽。大部分网友是不相信95%的满意度这个结果的,有关春晚的吐槽段子也是随处可见。小部分网友认为结果有可能是合理的,因为每逢佳节倍思亲,能看到春晚自然倍感亲切,自然是好评如潮。 95%的满意度到底是否可信?我们先来看新闻源,毕竟判断一个数据是否可信的前提是数据来源是否…
-
新手学习:一张图看懂史上最完整的数据分析流程
一个完整的数据分析流程,应该包括以下几个方面,建议收藏此图仔细阅读。完整的数据分析流程: 1、业务建模。 2、经验分析。 3、数据准备。 4、数据处理。 5、数据分析与展现。 6、专业报告。 7、持续验证与跟踪。 作为数据分析师,无论最初的职业定位方向是技术还是业务,最终发到一定阶段后都会承担数据管理的角色。因此,一个具有较高层次的数据分析师需要具备完整的知…
-
什么是伯努利分布?
伯努利分布是指一个分布离散型概率分布,为纪念瑞士科学家雅各布布?伯努利而命名。
-
什么是不等距分组?
不等距分组又称异距分组,各组组距并不完全相等的分组。它适用于标志值变动很不均匀的情况。
-
什么是标准误差?
什么是标准误差(Standard error),也称均方根误差(Root mean squared error)?
-
什么是标准偏差?
标准偏差(也称标准离差或均方根差)是反映一组测量数据离散程度的统计指标。
-
什么是变量?
变数或变量,是指没有固定的值,可以改变的数。