R语言
-
R语言入门秘录7/25:创建向量
数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。
-
R语言入门秘录6/25:读取CSV文件
数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。
-
R语言入门秘录5/25:读取表格数据文件
数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。
-
Facebook社交网络R语言分析
摘要:随着社交网络的普及,越来越多的用户通过facebook等社交平台联系到了一起。本文将基于facebook的好友关系数据,研究用户分布规律,并提供简单的好友推荐算法。 数据来源 KONECT【1】 http://konect.uni-koblenz.de/networks/facebook-wosn-links 数据原始格式 Note:好友信息以无向图的…
-
R语言入门秘录4/25:在网上搜索帮助信息
数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。
-
R语言入门秘录3/25:查看R的文档
数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。
-
Hadley Wickham:一个改变了R的人
Hadley Wickham 是 RStudio 的首席科学家以及 Rice University 统计系的助理教授。他是著名图形可视化软件包ggplot2的开发者,以及其他许多被广泛使用的软件包的作者,代表作品如plyr、reshape2等。 通过数据从根本上了解世界真的是一件非常,非常酷的事情。 ~多产的R开发者Hadley Wickham *** 如果…
-
如何让Hadoop结合R语言做大数据分析?
【编者按】R是GNU的一个开源工具,具有S语言血统,擅长统计计算和统计制图。由Revolution Analytics发起的一个开源项目RHadoop将R语言与Hadoop结合在一起,很好发挥了R语言特长。广大R语言爱好者借助强大工具RHadoop,可以在大数据领域大展拳脚,这对R语言程序员来说无疑是个喜讯。作者从一个程序员的角度对R语言和Hadoop做了一…
-
R语言入门秘录2/25:获取函数的帮助
数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。
-
R语言入门秘录1/25:下载和安装R
问题: 要把R安装到自己的电脑上。 解决方案: Windows和OS X用户可以从CRAN(Comprehensive R Archive Network)上下载R。Linux和Unix用户则可以用各自的包管理工具安装R软件包。 Windows 在浏览器中打开http://www.r-project.org/。 点击“CRAN”。然后会看到按国家排序的镜像站…
-
用R语言进行数据分析:如何绘制各国地图?
摘要:本文主要包含三种绘制地图的方法:绘制基础地图、基于空间数据格式(shapefile)绘制地图以及如何调用百度地图和谷歌地图的数据来绘制地图。 基础地图 方法 从map()包里获取地图数据,用geom_polygon()(可以用颜色填充)或者geom_path()(不能填充)绘制。 #install.packages(“ggplot2”) #instal…
-
机器学习编程语言之争,Python夺魁
摘要:随着科技的发展,拥有高容量、高速度和多样性的大数据已经成为当今时代的主题词。数据科学领域中所采用的机器学习编程语言大相径庭。究竟哪种语言最适合机器学习成为争论不休的话题。 近日,密西根州立大学的博士生Sebastian Raschka再次发起了机器学习编程语言之争,分析了自己选择Python的原因。 目前,机器学习牵涉的编程语言十分多样,包括了MATL…
-
用一行R代码,实现繁琐的数据可视化
摘要:看完这篇文章,可视化不再是难题。 ggfortify 是一个简单易用的R软件包,它可以仅仅使用一行代码来对许多受欢迎的R软件包结果进行二维可视化,这让统计学家以及数据科学家省去了许多繁琐和重复的过程,不用对结果进行任何处理就能以 ggplot 的风格画出好看的图,大大地提高了工作的效率。 ggfortify 已经可以在 CRAN 上下载得到,但是由于最…
-
SAS与R优缺点讨论:从工业界到学界 ?
导读:尽管这个话题已经讨论过很多次,但是这个翻译是比较系统的总结了一下两个软件的优缺点,值得一看。PS: 此话题已老,推荐新人看,另见以前一篇SAS评论引发的思考 by sxlion 摘要:尽管在工业界还是被 SAS 所统治,但是 R 在学术界却得到广泛的应用,因为其免费、开源的属性使得用户们可以编写和分享他们自己的应用。然而,许多正在获得数据分析相关学位的…
-
用R语言进行数据分析:常用函数参考
基本 一、数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 seq,from:to,sequence:等差序列 rep:重复 NA:缺失值 NULL:空对象 sort,order,…