前面系列文章,介绍了R语言中的几种数据格式;其它特殊的数据格式将在后续的文章中介绍,接下来的几篇文章,将讨论如何从外部中读入数据或者将其它格式的数据读入到R环境中;
scan()函数
scan(file = “”, what = double(0), nmax = -1, n = -1, sep = “”,
quote = if(identical(sep, “n”)) “” else “‘””, dec = “.”,
skip = 0, nlines = 0, na.strings = “NA”,
flush = FALSE, fill = FALSE, strip.white = FALSE,
quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE,
comment.char = “”, allowEscapes = FALSE, encoding = “unknown”)
一、主要的参数说明如下:
1)what:声明读入为字符类型数据,可能指定读入的精度/类型,例如:what=integer(0);what=numeric(0);what=character(0);
如果SCAN()读入有字符与数字,用what=””来进行声明,则会把读入的数字隐式的都转变成字符;
2)SEP:指定各个读入的数据之间的分隔符;默认情况下分隔符:空格、tab;如果不是其它分隔符,例如“:/”通过SEP来指定;
3)可以通过list指定读入变量的变量名,同时生成的对象为列表,则可以同时读入字符与数字;
4)Skip 从第几行开始读入数据;
5)Nlines 指定最大读入行数;
6)如果通过键盘输入的时候,不希望出现下标提示,则可以使用:quiet=TRUE;
7)encoding =””指定的编码格式,有时候读入的中文可能会出现乱码的时候,可能通过这个参数来指定:Latin-1 或者 UTF-8;
二、SCAN几点注意:
1)用于读入纯字符或者数字,没有表头;
2)如果输入的单一类型的变量,例如均是:数值或者均是字符,用scan效率更高。但其不能读入混合类型的数据,也就是在scan()读入的必须同为字符或者同为数值;
3)默认情况下用scan读入的数据生成向量类型(这也就是为什么读入的数据必须是同为字符或者同为数字)。
三、案例说明
1、手工输入数据
1)从键盘中输入数字
2、从外部读入
1)从D盘读入TXT文件,例如:
3、如果读入的数据中有字符或者数字,可以通过list来进行指定,则生成的对象是列表格式,如下:
4、指定输入字符的编码类型
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。