原假设为H0:数据集符合χ²分布
研究假设H1:样本所来自的总体分布不符合χ²分布。
令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数.
统计量D为: D=max|F0(x) - Fn(x)|
D值越小,越接近0,表示样本数据越接近χ²分布
p值,如果p-value小于显著性水平α(0.05),则拒绝H0
> set.seed(1000) > data <- rchisq(1000,1) > ks.test(data,'pchisq',1) One-sample Kolmogorov-Smirnov test data: data D = 0.0363, p-value = 0.1433 alternative hypothesis: two-sided
结论: D值很小, p-value>0.05,不能拒绝原假设,所以数据集data符合df=1的卡方分布!