由卡方分布延伸出来皮尔森卡方检定常用于:
(1)样本某性质的比例分布与总体理论分布的拟合优度;
(2)同一总体的两个随机变量是否独立;
(3)二或多个总体同一属性的同素性检定。
数学定义
若k个随机变量Z_1、……、Z_k是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量Z的平方和
![](https://upload.wikimedia.org/math/1/8/1/181776d8fe5a35865529c7a7a7157f9d.png)
被称为服从自由度为 k 的卡方分布,记作
![](https://upload.wikimedia.org/math/d/f/e/dfec0484bdccc45a71e8393cb6e02c3f.png)
卡方分布的概率密度函数为:
![](https://upload.wikimedia.org/math/7/c/6/7c6754d1c597c0bfdc98d52ab3e2ff72.png)
其中x≥0,当x≤0时f_k(x)=0。这里Γ代表Gamma函数
set.seed(1000) x<-seq(0,10,length.out=1000) y<-dchisq(x,1) plot(x,y,col="red",xlim=c(0,5),ylim=c(0,2),type='l', xaxs="i", yaxs="i",ylab='density',xlab='', main="The Chisq Density Distribution") lines(x,dchisq(x,2),col="green") lines(x,dchisq(x,3),col="blue") lines(x,dchisq(x,10),col="orange") legend("topright",legend=paste("df=",c(1,2,3,10)), lwd=1, col=c("red", "green","blue","orange"))
结果如下:
![](http://dl2.iteye.com/upload/attachment/0103/6041/bd765f2f-00a9-372b-97b3-91b3761e364f.png)