考虑进口总额Y与三个自变量:国内总产值X1、存储量X2、总消费量X3之间的关系:
1、输入数据
x1=c(149.3, 161.2, 171.5, 175.5, 180.8, 190.7,202.1, 212.4, 226.1, 231.9, 239.0)
x2=c(4.2, 4.1, 3.1, 3.1, 1.1, 2.2, 2.1, 5.6, 5.0, 5.1, 0.7)
x3=c(108.1, 114.8, 123.2, 126.9, 132.1, 137.7,146.0, 154.1, 162.3, 164.3, 167.6)
y=c(15.9, 16.4, 19.0, 19.1, 18.8, 20.4, 22.7,26.5, 28.1, 27.6, 26.3)
读入数据:
install.packages(“readxl”)
library(readxl)
read_excel(“data.xlsx”)
2、散点图了解变量之间的关系:
par(mfrow=c(3,1))
plot(x1,y,xlab=“国内总产值”, ylab=“进口总额”);plot(x2,y,xlab=“存储量”, ylab=“进口总额”);plot(x3,y,xlab=“总消费量”, ylab=“进口总额”)
3、将数据输入数据框,相关系数分析
conomy<-data.frame(x1,x2,x3,y)
cor(conomy)
4、多重共线性检验
x<-data.frame(x1,x2,x3)
XX=cor(x)
kappa(XX,exact=TRUE)
eigen(XX)
5、尝试运用逐步回归法进行消除多重共线性
lm.sol<-lm(y~x1+x2+x3, data=conomy)
summary(lm.sol)
lm.ste<-step(lm.sol)
6、主成分分析
conomy.pr<-princomp(~x1+x2+x3, data=conomy, cor=T)
summary(conomy.pr, loadings=TRUE)
7、主成分回归分析
pre<-predict(conomy.pr)
conomy
z2<-pre[,2]
lm.sol<-lm(y~z1+z2, data=conomy)
summary(lm.sol)
8、做变换,得到原坐标下的关系表达式
beta<-coef(lm.sol);
A<-loadings(conomy.pr)
x.bar<-conomy.pr
scale
coef<-(beta[2]*A[,1]+ beta[3]*A[,2])/x.sd
beta0 <- beta[1]- sum(x.bar * coef)
c(beta0, coef)