R
-
R语言入门秘录2/25:获取函数的帮助
数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。
-
R语言入门秘录1/25:下载和安装R
问题: 要把R安装到自己的电脑上。 解决方案: Windows和OS X用户可以从CRAN(Comprehensive R Archive Network)上下载R。Linux和Unix用户则可以用各自的包管理工具安装R软件包。 Windows 在浏览器中打开http://www.r-project.org/。 点击“CRAN”。然后会看到按国家排序的镜像站…
-
用R语言进行数据分析:如何绘制各国地图?
摘要:本文主要包含三种绘制地图的方法:绘制基础地图、基于空间数据格式(shapefile)绘制地图以及如何调用百度地图和谷歌地图的数据来绘制地图。 基础地图 方法 从map()包里获取地图数据,用geom_polygon()(可以用颜色填充)或者geom_path()(不能填充)绘制。 #install.packages(“ggplot2”) #instal…
-
用一行R代码,实现繁琐的数据可视化
摘要:看完这篇文章,可视化不再是难题。 ggfortify 是一个简单易用的R软件包,它可以仅仅使用一行代码来对许多受欢迎的R软件包结果进行二维可视化,这让统计学家以及数据科学家省去了许多繁琐和重复的过程,不用对结果进行任何处理就能以 ggplot 的风格画出好看的图,大大地提高了工作的效率。 ggfortify 已经可以在 CRAN 上下载得到,但是由于最…
-
用R语言进行数据分析:常用函数参考
基本 一、数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 seq,from:to,sequence:等差序列 rep:重复 NA:缺失值 NULL:空对象 sort,order,…
-
用R语言进行数据分析:命令行编辑器
C.1 预备工作 如果你的 UNIX 系统已经安装了 GNU readline 库, 那么 R 配置中允许在 UNIX 下编译 R 代码,调用内置的 命令行编辑器,编辑和重新调用以前用过的命令。 注意:该附录提到的接口不是用于 UNIX 系统的 GNOME接口,而仅仅用于标准的命令行 接口。 如果启动时设置了参数 –no-readline (使用…
-
用R语言进行数据分析:一个简单的会话
下面的会话让你在操作中对 R 环境的一些特性有个简单的了解。你对系统的许多特性开始时可能 有点不熟悉和困惑,但这些迷惑会很快 消失的。 登录,启动你的桌面系统。 $ R 以适当的方式启动 R。R 程序开始,并且有一段引导语。 (在 R 里面,左边的提示符将不会被显示防止 混淆。) help.start() 启动 HTML 形式的在线帮助(使用你的计算机里面 …
-
用R语言进行数据分析:包
所有的 R 函数和数据集是保存在(packages)里面的。只有当一个 包被载入时,它的内容才可以被访问。这样做一是为了高效 (完整的列表会耗去大量的内存并且增加搜索的时间), 一是为了帮助包的开发者防止命名和其他代码的中的名字冲突。 这里,我们仅仅从用户的角度来 描述这个问题。 可以使用下面的命令查看你当前环境中安装的包 > library() 命令…
-
用R语言进行数据分析:统计图形
图形工具是 R 环境里面一个非常重要和多用途的组成部分。 我们可以用这些图形工具显示 各种各样的统计图并且创建一些 全新的图。 图形工具既可交互式使用,也可以批处理使用。在许多情况下, 交互式使用是最有效的。 打开 R 时,它会启动一个图形设备驱动 (device driver)。该驱动会打开特定的图形窗口(graphics window)以显示 交互式的图…
-
用R语言进行数据分析:最小二乘法和最大似然法
特定形式的非线性模型可以通过广义线性模型 (glm()) 拟合。但是许多时候,我们必须把非线性拟合的问题 作为一个非线性优化的问题解决。 R的非线性优化程序是 optim() 和 nlm()。 二者分别替换 S-Plus 的 ms() 和 nlminb()。我们通过搜寻 参数值使得缺乏度(lack-of-fit)最低,如 nlm() 就是通过循环调试各种参数…
-
用R语言进行数据分析:方差分析模型
方差分析和模型比较 模型拟合函数 aov(formula, data=data.frame) 和函数 lm() 非常的相似,在Generic functions for extracting model information 部分列出的泛型函数同样适用。 需要注意的是 aov() 还允许分析 多方差层次的模型,如裂区实验设计, 利用区组内信息进行的平衡不完…
-
用R语言进行数据分析:常规和广义线性模型
线性模型 对于常规的多重模型(multiple model)拟合,最基本的函数是lm()。 下面是调用它的方式的一种改进版: > fitted.model <- lm(formula, data = data.frame) 例如 > fm2 <- lm(y ~ x1 + x2, data = production) 将会拟合 y 对 …
-
用R语言进行数据分析:定义统计模型的公式
下面的统计模型的模板是一个基于 独立的方差齐性数据的线性模型 y_i = sum_{j=0}^p beta_j x_{ij} + e_i, i = 1, …, n, 其中 e_i 属于 NID(0, sigma^2)。 用矩阵格式表示,它可以写为 y = X beta + e 其中 y 是响应向量,X 是模型 矩阵(model matrix)或者设计矩阵…
-
用R语言进行数据分析:编写函数
正如前面内容所暗示的一样,R 语言允许用户 创建自己的函数(function)对象。R 有一些 内部函数并且可以用在 其他的表达式中。通过这个过程,R 在程序的功能性, 便利性和优美性上得到了扩展。学写这些有用的函数 是一个人轻松地创造性地使用 R 的 最主要的方式。 需要强调的是,大多是函数都作为 R 系统的一部分提供,如mean(), var(), po…
-
用R语言进行数据分析:循环和条件控制
成组表达式 R 是一种表达式语言(expression language)因为它仅有的命令形式 是返回结果的函数和表达式。赋值操作实际上 也是一个表达式结果的再分配,并且可以用在 任何表达式中,甚至多重赋值 也是允许的。 命令可以用大括弧圈在一起 {expr_1; …; expr_m}。此时,这一组命令的结果 是该组中最后一个命令的值。既然一个组…