- 数据框是一种表格式的数据结构。数据框旨在模型数据集,与其他统计软件列如SAS或者SPSS中的数据集概念一致。
- 数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。不同的行业对于数据集的行和列叫法不同。
- 数据框实际上是一个列表。列表中的元素是向量,这些向量构成数据框的列,每一列必须具有相同的长度,所有数据框是矩形结构,而且数据框的列必须命名。
- 数据框形状上很像矩阵,其实是比较规则的列表,数据框的每一列必须为同一2类型,每一行可以不同
- 数据框通过data.frame函数来创建
- 数据框的访问
同样用[]来进行索引,索引输出的包括行名和列名
添加“-”索引代表去掉这部分内容,利用行和列的名字也可以对应取出
data.frame的名字[,“列名”]注意加逗号
data.frame的名字[“行名”,]
也可用$符号取出
eg用R中的内置数据集women进行访问并绘制plot图
women
plot(women$height,women$weight)
用lm进行线性回归的时候给出列名即可
eg
lm(weight~height,data=women)
如果一次访问多列用$符访问也比较麻烦
用attach绑定数据之后直接可在命令框输入列名不用 $符即可,使用完数据框要用detach函数解绑数据
同样with函数也可以完成相同的结果,无需 $符,直接敲列名
eg
with(women,{height})