R语言

  • 31个与大数据有关的非常不错的资源和文章(附全链接)

    资源 1.用贝叶斯模型计算我的妻子是否怀孕 2.在基础R中使用插值法和平滑功能 3.数据兵工厂里的武器:R vs Spark【这个链接好像挂了~】 4.最好的大数据、数据科学、数据挖掘和机器学习播客视频大全 5.数据科学的线性模型导论 6.黑客读物:数据统计 7.Apache Spark-执行概要 8.随机vs非随机:如何叙述差异 9.面向时间数据可视化技术…

    2016-03-11
    0
  • R语言和Python —— 一个错误的分裂

    最近有一些文章提出与年龄相关的问题:“ 崭露头角的年轻数据科学家们是学习R语言还是Python更好 “ 答案似乎都是“视情况而定”,在现实中没有必要在R和Python中做出选择,因为你两个都用得到。 它被称为RPy2: http://rpy.sourceforge.net/rpy2/doc-2.1/html/introduction.html 什…

    2016-03-09
    0
  • 【R】如何确定最适合数据集的机器学习算法

    摘要:抽查(Spot checking)机器学习算法是指如何找出最适合于给定数据集的算法模型。本文中我将介绍八个常用于抽查的机器学习算法,文中还包括各个算法的 R 语言代码,你可以将其保存并运用到下一个机器学习项目中。 适用于你的数据集的最佳算法 你无法在建模前就知道哪个算法最适用于你的数据集。你必须通过反复试验的方法来寻找出可以解决你的问题的最佳算法,我称…

    2016-03-02
    0
  • Mango中国区数据总监:一个数据科学家的这些年

    摘要:这篇文章来自于我和肖凯的新作《数据科学中的R语言》的前言。原书受篇幅和语言风格所限,前言经过了一些删减,在这里将全文和增补的内容发布出来。为了尽量避免为新书打广告的嫌疑,先提前声明我们会把书中一些自认为比较有价值的经验和见解发布到统计之都上,只是希望对数据科学和R语言有个基本的认识或者了解一些作者的建议和感悟的读者大可不必去买这本书,只有对具体案例和技…

    2016-02-29
    0
  • R语言 vs Python:数据分析哪家强?

    摘要:这篇文章旨在更客观地看待这两门语言。我们会平行使用Python和R分析一个数据集,展示两种语言在实现相同结果时需要使用什么样的代码。这让我们了解每种语言的优缺点,而不是猜想。在Dataquest,我们教授两种语言,并认为两者在数据科学工具箱中都占据各自的地位。 我们将会分析一个NBA数据集,包含运动员和他们在2013-2014赛季的表现,可以在这里下载…

    2016-02-28
    0
  • R语言:ggplot2精细化绘图——以实用商业化图表绘图为例

    摘要:本文旨在介绍R语言中ggplot2包的一些精细化操作,主要适用于对R画图有一定了解,需要更精细化作图的人,尤其是那些刚从excel转ggplot2的各位,有比较频繁的作图需求的人。不讨论那些样式非常酷炫的图表,以实用的商业化图表为主。包括以下结构: 1、画图前的准备:自定义ggplot2格式刷2、画图前的准备:数据塑形利器dplyr / tidyr介绍…

    2016-02-22
    0
  • 提升R语言运算效率的11个实用方法

    众所周知,当我们利用R语言处理大型数据集时,for循环语句的运算效率非常低。有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升。本文将介绍几种适用于大数据领域的方法,包括简单的逻辑调整设计、并行处理和Rcpp的运用,利用这些方法你可以轻松地处理1亿行以上的数据集。 让我们尝试提升往数据框中添加一个新变量过程(该过程中包含循环和判断…

    2016-02-16
    0
  • 近200篇机器学习、深度学习资料分享

    摘要:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等。而且原文也会不定期的更新,望看到文章的朋友能够学到更多。 《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost 到随机森林、Deep Learning. 《De…

    2016-02-15
    0
  • R语言中的情感分析与机器学习

    利用机器学习可以很方便的做情感分析。本篇文章将介绍在R语言中如何利用机器学习方法来做情感分析。在R语言中,由Timothy P.Jurka开发的情感分析以及更一般的文本挖掘包已经得到了很好的发展。你可以查看下sentiment包以及梦幻般的RTextTools包。实际上,Timothy还写了一个针对低内存下多元Logistic回归(也称最大熵)的R包maxt…

    2016-02-14
    0
  • R语言有助于提高数据处理效率的7个包

    引言 数据处理是建立预测模型时不可避免的一步。一个稳健的预测模型不是仅仅依靠机器学习算法就可以建立的,相反,它还需要依靠一定的方法,这些方法帮助人们理解商业问题,了解潜在数据集,进行必要的数据处理工作并提取出有用的商业信息。 在这些建模阶段里,大多数时间通常都被花在了解潜在数据集和进行必要数据处理上。这也是这篇文章的焦点——谈一谈R中可提高数据处理效率的包。…

    2016-02-04
    0
  • R语言入门秘录25招

    本系列文章内容翻译自O’reilly出版社的 25 Recipes for Getting Started with R 一书。

    2016-02-01
    0
  • 随机森林入门攻略(内含R、Python代码)

    简介近年来,随机森林模型在界内的关注度与受欢迎程度有着显著的提升,这多半归功于它可以快速地被应用到几乎任何的数据科学问题中去,从而使人们能够高效快捷地获得第一组基准测试结果。在各种各样的问题中,随机森林一次又一次地展示出令人难以置信的强大,而与此同时它又是如此的方便实用。 需要大家注意的是,在上文中特别提到的是第一组测试结果,而非所有的结果,这是因为随机森林…

    2016-01-24
    0
  • R语言入门秘录25/25:访问包中的函数

    数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。

    2016-01-20
    0
  • R语言入门秘录24/25:预测新的值

    数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。

    2016-01-19
    0
  • R语言入门秘录23/25:检查线性回归

    数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。

    2016-01-18
    0
关注我们
关注我们
分享本页
返回顶部