数据科学家
-
数据科学极简史(二)
2002 年 4 月,数据科学期刊(Data Science Journal)创刊,旨在发表「科学与技术领域的数据与数据库管理」方面的论文。「此期刊涵盖对于数据系统的描述,及其在互联网上的发布、应用和法律问题。」此期刊由国际科学理事会(International Council for Science )旗下的数据科学技术委员会(Data for Scien…
-
数据科学极简史(一)
数据科学家如何变得性感的故事,大致也就是作为成熟学科的统计学如何与新兴学科计算机科学发生关系的故事。“数据科学”这个术语的出现较晚近,用来指代一个需要解读大量数据的职业。但解读数据这件事的历史很长,它已经被科学家、统计学家、图书馆员、计算机科学家以及其他人士讨论多年。下文的时间线追溯“数据科学”一词的演化,以及它的应用、对它进行定义的尝试和一些相关的术语。 …
-
R语言和Python —— 一个错误的分裂
最近有一些文章提出与年龄相关的问题:“ 崭露头角的年轻数据科学家们是学习R语言还是Python更好 “ 答案似乎都是“视情况而定”,在现实中没有必要在R和Python中做出选择,因为你两个都用得到。 它被称为RPy2: http://rpy.sourceforge.net/rpy2/doc-2.1/html/introduction.html 什…
-
在twitter搞数据科学是怎样一种体验?
摘要:回顾两年来的心路历程,样本量N=1 原文:Doing Data Science at Twitter 原作者: Robert Chang 引子 2015年6月17日是我在Twitter工作两周年的纪念日。回想起来,两年间,数据科学在Twitter的应用方式和范围发生了很大变化: · 许多Twitter的非机器学习主导的核心产品中,机器学习的比重正在不断…
-
大数据科学工具包(万余字介绍几百种工具,经典收藏版!)
前言:数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学、概率模型、统计学、机器学习、数据仓库、可视化等。在实际应用中,数据科学包括数据的收集、清洗、分析、可视化以及数据应用整个迭代过程,最终帮助组织制定正确的发展决策数据科学的从业者称为数据科学家。数据科学家有其独特的基本思路与常用工具,秦陇纪全面梳理数据分析师和数据科学家使用的工具包,包括…
-
数据科学产业科普:不同的职业所扮演的不同角色
概述:数据科学是近年来最热门的话题之一,其就业前景一片光明。但很多人对该领域的诸多职位和从事的工作仍然不是很了解。本篇文章可以很好的解答这个困惑。 数据科学家 掌握语言:R、SAS、Python、Matlab、SQL、Hive、Pig、Spark 技术及才能: 分布式计算 预测建模 数据的故事设计与可视化 数学理论、统计基础与机器学习 角色职责:大数据的清理…
-
从学历到就业情况,7张图描绘美国大数据人才的高薪路径
摘要:目前全球有11400个数据科学家,其中52%的人在过去4年中获得了这个头衔。他们来自哪里?他们在哪里工作?他们在做什么? 基于由RJMetrics做的大量研究,分析了3.6亿的LinkedIn领英个人资料,我们能够回答这些问题,绘出数据科学的现状图以及了解更多。 在这篇文章中,我们将看到7个图表,了解到数据科学家的教育程度,他们的研究领域,工作的地理位…
-
面试干货!21个必知数据科学面试题和答案part2(12-21)
摘要:这里是第二部分,就从我给大家准备的“特别提问”开始吧。作者Gregory Piatetsky,KDnuggets. 特别提问:解释什么是过拟合,你如何控制它 这个问题不是20问里面的,但是可能是最关键的一问来帮助你分辨真假数据科学家! 回答者:GregoryPiatetsky 过拟合是指(机器)学习到了因偶然造成并且不能被后续研究复制的的虚假结果。 我…
-
面试干货!21个必知数据科学面试题和答案part1(1-11)
摘要:KDnuggets编辑给你“20个问题来分辨真假数据科学家”的答案,包括什么是正则化、我们崇拜的数据科学家、模型验证等等。 作者:Gregory Piatetsky, KDnuggets. 最近KDnuggets上发的“20个问题来分辨真假数据科学家”这篇文章非常热门,获得了一月的阅读量排行首位。 但是这些问题并没有提供答案,所以KDnuggets的小…
-
数据科学的统计学入门
统计学是门严肃的学科,很多人穷尽一生来学习研究它。
-
Mango中国区数据总监:一个数据科学家的这些年
摘要:这篇文章来自于我和肖凯的新作《数据科学中的R语言》的前言。原书受篇幅和语言风格所限,前言经过了一些删减,在这里将全文和增补的内容发布出来。为了尽量避免为新书打广告的嫌疑,先提前声明我们会把书中一些自认为比较有价值的经验和见解发布到统计之都上,只是希望对数据科学和R语言有个基本的认识或者了解一些作者的建议和感悟的读者大可不必去买这本书,只有对具体案例和技…
-
学神之路 —— Python数据科学全攻略
Python菜鸟到Python Kaggler 如果你梦想成为一名数据科学家,或者已然是数据科学家的你想扩展自己的工具库,那么,你找对地方啦。本文旨在为做数据分析的Python人提供一条全方位的学习之路,完整讲述运用Python进行数据分析的所有步骤。当然,如果你已经有了一些知识储备,或者无需掌握全部的内容,可以按照自己的需求做出调整,也欢迎与我们分享你是如…
-
塔谱大中国区销售总监Thomas Yap:培育分析文化,从领导层开始
摘要:在大数据时代,各行业企业越来越需要依靠数据来进行日常决策并发掘其相关价值潜力。 在大数据时代,各行业企业越来越需要依靠数据来进行日常决策并发掘其相关价值潜力。从传感器数据到网站数据,再到销售数据,企业中可被量化和依靠数据进行分析的业务日益增多。但是这带来的问题很多,其中之一就是:企业需要越来越重视数据科学家的作用,他们的分析能力在业务中举足轻重。但实际…