数据文件读写
1、R语言读取文本文件:
1.1、获取和设置工作目录
您可以使用getwd()函数检查R语言工作区指向的目录。 您还可以使用setwd()函数设置新的工作目录。
# Get and print current working directory.
print(getwd())
# Set current working directory.
setwd("/web/com")
# Get and print current working directory.
print(getwd())
当我们执行上面的代码,它产生以下结果 -
[1] "/web/com/1441086124_2016"
[1] "/web/com"
1.2、常用的读取指令read
read.table() : 读取文本文件 ,函数详细解释参考 http://www.cnblogs.com/xianghang123/archive/2012/06/06/2538274.html
read.csv(): 读取csv文件
如果出现缺失值,read.table()会报错,read.csv()读取时会自动在缺失的位置填补NA
1.3、灵活的读取指令scan() :
1.4、读取固定宽度格式的文件:read.fwf()
文本文档中最后一行的回车符很重要,这是一个类似于停止符的标识,否则读入时会显示“最后一行不完整”的警告,但是不影响数据读入的效果。
1.5、读取Excel数据:
(1)第一种方法
首先打开Excel,选中需要的数据后复制,
然后再R中输入以下的指令:data.excel =read.delim("clipboard") #clipboard即剪贴板
(2)第二种方法:
使用RODBC包,获取Excel连接的函数是odbcConnectExcel()和odbcConnectExcel2007() 分别读取Excel2003版和2007版的数据channel =odbcConnectExcel2007("d:/a.xlsx")
sqlTables(channel)# 列出Excel中的表格
获取Sheet1中的数据,可以使用如下任意的一种方式,
data.excel2 =sqlFetch(channel,"Sheet1")
data.excel2 =sqlQuery(channel,"select * from [Sheet1$]")
close(channel) #关闭ODBC连接,释放空间
1.6、读取网页数据
readHTMLTable()函数
1.7、读取R格式的文件:
R的数据或者更一般的对象可以通过save()保存为R专有的文件格式,以Rdata为后缀,要读取此类文件,需要用到函数load()来加载,
1.8、readLines("d:/data/cat.txt"): 可以直接从连接中以行的形式来读取文本
要显示列表中的变量 需要使用符号$
2、数据保存
1、使用函数cat()
cat(...,file="",sep="",fill = FALSE ,labels=NULL,append=FALSE) #file表示要输出的文件名,当参数append=TRUE时,在指定文件的末尾添加内容。sep:表示以空格作为分隔符
2、保存为文本文件:
write仅可以写出一个矩阵或向量的特定列,和对一个矩阵进行转置
write.table() 可以把一个数据框或列表等对象以包含行列标签的方式写出。
write.csv(): 将数据框保存为逗号分隔文件,但是不包含列名
3、保存R格式文件:
save(data,file="d:/data/salary1.Rdata")
dim():求维度
mode() 用来显示对象的类型
names():显示对象中的标签