R
-
用R语言进行数据分析:检验一个数据集的分布
我们可以用很多方法分析一个单变量的数据集。 最简单的办法就是直接看数字。利用函数 summary 和 fivenum 会得到 两个稍稍有点差异的汇总信息。 此外,stem (“茎叶”图)也会反映整个数据集的数字信息的。 > attach(faithful) > summary(eruptions) Min. 1st Qu. Median Mean…
-
用R语言进行数据分析:R的统计表
R的统计表 R给出了详尽的统计表。R 还提供了相关函数来 计算累计概率分布函数 X <= x), 概率密度函数和分位数函数(给定 q,符合 P(X <= x) > q的最小x就是对应的分位数), 和基于概率分布的计算机模拟。 概率分布 R 对应的名字 附加参数 β分布 beta shape1, shape2, ncp 二项式分布 binom…
-
用R语言进行数据分析:数据的输入与输出之READ函数
read.table() 函数1、用于读入表格(表)类型的数据,同时生成数据框对象。2、读入的数据要求有规则的分隔符,默认有:空格、TAB、换行符、回车符;其它的分隔符,通过sep=来进行指定。 read.table(file, header = FALSE, sep = “”, quote = “”̵…
-
用R语言进行数据分析:数据的输入与输出之Scan函数
前面系列文章,介绍了R语言中的几种数据格式;其它特殊的数据格式将在后续的文章中介绍,接下来的几篇文章,将讨论如何从外部中读入数据或者将其它格式的数据读入到R环境中; scan()函数 scan(file = “”, what = double(0), nmax = -1, n = -1, sep = “”, q…
-
用R语言进行数据分析:列表
通过list函数来创建列表,例如,创建一个包含三个列的列表,请注意与R语言中的列表显示有什么不一样: 1、创建列表demo_1 2、创建数据框demo_1_1 ·列表对每个列显示都会单独以一行的形式存在; ·数据框则是以表(或者是矩阵)的形式显示;所以根据数据输出的格式可以判断是列表还是数据框; 创建一个示例列 Demo_2<-list(name=c(…
-
用R语言进行数据分析:数据框
前面几篇文章对R语言、R包以及R向量与矩阵等对象做了简单介绍,本篇继续介绍R数据框的相关内容。 数据框的创建 通过data.frame函数来创建数据框,该函数包含的主要参数为: data.frame(…, row.names = NULL, check.rows = FALSE, check.names = TRUE, stringsAsFact…
-
用R语言进行数据分析:矩阵
矩阵的创建 在R中用函数matrix()来创建一个矩阵,使用该函数时需要输入必要的参数值。matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE,dimnames = NULL) 1. data向量元素列表 2. nrow行数 3.ncol列数 4.byrow 矩阵是按列优先的方式进行排序, 先列后行。byro…
-
用R语言进行数据分析:向量
图一 R语言的数据对象类型简介图 在本系列文章中,接下将分别介绍R语言的几种数据对象:向量、矩阵、数据框与列表、其它特殊对象; 请大家在学习R语言的时候永远记住一个概念,R语言所有内容都是对象; 一、向量基本概念 R语言中最为核心的构成之一 1、向量构成的基本元素为:数值(numeric)、字符(character)、逻辑值(logical)、复数型(com…
-
用R语言进行数据分析:R包介绍
R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求,截至2013年3月6日,CRAN已经收录了各类包4338个。 一、 R语言包的安装 1、通过选择菜单: 程序包->安装程序包->在弹出的对话框中,选择你要安装的包,然后确定。 3、移除包出内存 detach() 4、把其它包的数据…
-
R语言常用数据挖掘包汇总
与数据挖掘有关或者有帮助的R包和函数的集合。1、聚类常用的包: fpc,cluster,pvclust,mclust基于划分的方法: kmeans, pam, pamk, clara基于层次的方法: hclust, pvclust, agnes, diana基于模型的方法: mclust基于密度的方法: dbscan基于画图的方法: plotcluster,…
-
用R语言进行数据分析:获取和存储数据
① 如果只有很少的数据量,你可以直接用变量赋值输入数据。若要用交互方式则可以使用readline()函数输入单个数据,但要注意其默认输入格为字符型。scan()函数中如果不加参数则也可以用来手动输入数据。如果加上文件名则是从文件中读取数据。 ② 读取表格文件读取本地表格文件的主要函数是read.table(),其中的file参数设定了文件路径,注意路径中斜杠…
-
一篇文章告诉你,该学R还是Python
对于想从事数据行业的人和数据工作者来说,是学习R还是python,哪个工具更实用一直被大家争论。Martijn Theuwissen,DataCamp的教育专家详细比较了这两个工具。
-
做数据分析必须学R语言的4个理由
本文提供了一位统计学家Catherine Dalzell对 R 的价值的看法。
-
R语言学习由浅入深路线图
对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是——看书。目前,市面上介绍R语言的书籍很多,中文英文都有。那么,众多书籍中,一个生手应该从哪一本着手呢?入门之后如何才能把自己练就成某个方面的高手呢?相信这是很多人心中的疑问。有这种疑问的人有福…
-
浅析R语言的优势和缺点
R编程语言在数字分析与机器学习领域已经成为一款重要的工具。随着机器逐步成为愈发核心的数据生成器,该语言的人气也必然会一路攀升。不过R语言当然也拥有着自己的优势与缺点,开发人员只有加以了解后才能充分发挥它的强大能力。 R语言的优势 正如Tiobe、PyPL以及Redmonk等编程语言人气排名所指出,R语言所受到的关注程度正在快速提升。作为一款诞生于上世纪九十年…