今天看了一下R语言,感觉挺难的因为没有统计学和数据的功底,看着函数有些吃力。学习的过程是痛苦的,还是坚持着吧~今天把自己的学习笔记贴上来,后续应该会继续更新此文章。
1.一旦某一变量服从正态分布,就可以使用对用的统计学原理来预测不确定性变量的预测估计及其范围,并可以给出改预测值得可信度
2.网站分析的主要目的通过量化指标来衡量网站解决用户需求的能力,主线分为3个阶段:
1)有多少方可来到网站,可使用引流类指标衡量
2)网站对访客的黏性,他体现了用户在通过网站寻求解决自身的过程中,所体现出来的整体性能情况,可以用黏性指标来衡量
3)网站最后解决了多少用户的需求(产出或投入产出比)可使用产出指标来衡量
3.收集用户需求的途径:
网站中某关键性网页或区域的点击量和使用量
用户对网站的建议留言或问卷调查
用户在网站内搜索中输入的关键字
用户在站外搜索引擎中输入的关键字
用户对客服留言以及商品的评价
getwd() 读取工作路径
setwd() 设置
使用sink()命令可以将所有后续的输出由终端转向一个外部文件:
sink("d:/output.txt")
sink() #将把后续代码输出重新恢复到终端显示
运行R时,所有的变量、数据、函数都以对象的形式存在于计算机内存中。
save.image("d:/r.data")#把此前产生的所有空间数据存储在工作目录下 rm(list=ls())#删除工作空间内的所有对象数据 a<-c(1:20) save.image("d:/r.data") rm(a) a#会报不存在 load("d:/r.data") a #打印1--20 ??source 检索所有与source相关的信息 ?source 检索source 安装包: install.packages("qcc") R语言的数据类型: > a<-12.11 > mode(a) [1] "numeric" ================== > a<-11+1i > mode(a) [1] "complex" ================= > a<-T > mode(a) [1] "logical" ================= > a<-"aa" > mode(a) [1] "character" ===================== > a<-c(1,2,"a",NA,4) > a [1] "1" "2" "a" NA "4" > mean(a) [1] NA > length(a) [1] 5 ======================= > a<-c(1,2,"a",NULL,4) > a [1] "1" "2" "a" "4" > length(a) [1] 4 ========================= > a<-c(1,2,"a",NULL,NA,4) > isna(a) > is.na(a) [1] FALSE FALSE FALSE TRUE FALSE > is.null(a) [1] FALSE ================ > x<-numeric() > x numeric(0) > length(x) [1] 0 > x[2]<-1 > x [1] NA 1 =============== #建立数据框 > x<-data.frame(name1=c(1:5),name2=c("a","b","c","d","e")) > attributes(x) $names [1] "name1" "name2" $row.names [1] 1 2 3 4 5 $class [1] "data.frame" > ls() [1] "a" "x" > a [1] "1" "2" "a" NA "4" > x name1 name2 1 1 a 2 2 b 3 3 c 4 4 d 5 5 e >rm(list=ls())#删除对象数据 ============================ > a<-c(1,2,3,4)#创建数组,数组下表从1开始 > a [1] 1 2 3 4 > a[0] numeric(0) > a[1] [1] 1 > a[2] [1] 2 > a[-1] [1] 2 3 4 > which(a==3) [1] 3 > which.max(a) [1] 4 > which.min(a) [1] 1 > a<-c(1,2,3,4) > subset(a,a>2&a<4) [1] 3 > a<-c(a,c(2,2,2,2,2)) > a [1] 1 2 3 4 2 2 2 2 2 > a<-a[-3]#删除元素 > a [1] 1 2 4 2 2 2 2 2 ======================= > sort(a) [1] 1 2 2 2 2 2 2 4 > rev(a) [1] 2 2 2 2 2 4 2 1 > rev(sort(a)) [1] 4 2 2 2 2 2 2 1 > unique(a)#去重 [1] 1 2 4 ========================== > data<-c(1:10) > a<-matrix(data,ncol=2,nrow=5) > a [,1] [,2] [1,] 1 6 [2,] 2 7 [3,] 3 8 [4,] 4 9 [5,] 5 10 =============== 矩阵合并: cbind rbind
散布图(scatter plots)
plot()
xyplot()
qplot()
text()
smoothScatter()
matrix()
jitter()
rbinom()
rnorm()
lines()
lowess()
nls()
用的的包:
ggplot2
lattice
scattersplot3d