统计学
-
好看的统计图都是相似的,难看的统计图各有各的丑
不讲炫酷的、高大上的统计图,而是给大家分享如何画好最基础的统计图。
-
数据科学是一种自由的艺术吗?
怎样去给问题构建框架?怎样去交流你的结论?学习自由的艺术。
-
R语言中离群值的识别、描述、绘制与移除
统计学中离群值被定义为离开大部分观测较远的样本点,多数是由于测量误差而产生。因此,数据分析中离群值的识别和移除(如有必要)是很重要的一个步骤。
-
三个要点解构数据分析的思维模式
数据分析(Data Analysis)——这个词真的是如雷贯耳,装B一绝啊!
-
美国统计学研究方向与国内有什么区别?
美国统计学研究方向有哪些?与国内有何区别?
-
你是电商数据分析师
电商数据分析师 是一个数学、计算机、经济管理、电子商务于一体的交叉综合性知识 岗位。
-
【案例】洛杉矶警局如何用算法预测并制止犯罪行为
洛杉矶警局与加州大学洛杉矶分校合作,采集分析了80年来1300万起犯罪案件,用于进行犯罪行为的大型研究,通过算法预测成功将相关区域的犯罪率降低了36个百分点。
-
鲍忠铁:浅谈数据分析和数据建模
本文大部分内容来源于 Bart Baesens 所著《Analysis in a Big Data World:The Essential Guide to DataScience and its Applications》。中文书名为《大数据分析数据科学应用场景与实践精髓》柯晓燕张纪元翻译
-
t检验用不了?别慌,还有神奇的非参数检验
当数据不符合正态分布时,除转化为正态分布检验外,还可运用非参数检验的方法。
-
从“男人比女人孝顺”和“百度医疗竞价”说起,大数据需要科学和正直的品格
最近几天,一篇“一个死在百度和部门医院之手的年轻人”的新闻刷爆网络,又一次将百度的医疗竞价排名推到了风口浪尖。
-
商品搜索引擎的推荐系统设计方案
结合目前已存在的商品推荐设计(如淘宝、京东等),推荐系统主要包含系统推荐和个性化推荐两个模块。
-
用主成分法解决多重共线性问题
一、多重共线性的表现 线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系。看似相互独立的指标本质上是相同的,是可以相互代替的,但是完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。 二、多重共线性的后果1.理论后果 多重共线性是因为变量之间的相关程度比较高。 按布兰查德认为, 在计量经济学中, 多重共线性实质上是一个“微数…
-
量化研究影响用户使用红包的因素
摘要:由于本人论文还没发布,不变透露,因此具体内容都引用自苏帆帆. 移动阅读业务持续使用行为影响因素研究[D]. 北京邮电大学, 2011. 量化–发问卷 作者最近刚完成了毕业论文初稿,做的课题是关于电子红包的用户研究,研究影响用户使用红包的因素。整个采用了问卷调查+实证研究的模式,简单点来说就是发量表型问卷后分析数据,进行一些探索性或者验证性的…
-
数据科学家如何玩台球? – 技术篇
工作休息时间打打台球可以缓解一下神经,也可以更快的融入团队,但是开始水平太差,输多赢少,作为一个玩“数据”的,能不能通过数据科学优化一下这件事,至少多赢几局? 要赢一场球分为两个部分: 第一是要打的更准,总体来说,打的越准的人赢得概率更高,这个是硬实力; 第二是在准度一定的情况下,每一杆球,根据球形和对手,都要选择不同策略,策略包括击打对象,使用的力度,进攻…
-
数据变换的万能钥匙:Box-Cox变换
至于说什么时候应该用哪个函数来作变换,原文也针对常见的几种情况给出了一些建议。当然,我们会遇到的数据纷繁复杂,究竟用什么函数效果比较好,还是得通过反复尝试并实际验证才知道。