统计假设测验------(五)卡平方测验

一、卡平方(\chi ^{2})测验定义和分布

\chi ^{2}是相互独立的多个正态离差平方值的总和 。

\chi ^{2}=u_{1}^{2}+u_{2}^{2}+u_{i}^{2}+...+u_{n}^{2} =\sum_{i}^{n} u_{i}^{2}=\sum_{i}^{n}(\frac{y_{i}-\mu _{i}}{\sigma _{i}})^{2}

y_{i}服从真高分布N(\mu _{i},\sigma_{i}^{2}),y_{i}不一定来自同一个正态总体,即\mu _{i}\sigma_{i}可以是来自不同正态分布的参数。若研究对象属于同一个总体,则\mu _{i}=\mu\sigma_{i}^{2}=\sigma^{2}。所研究的总体\mu不知时,用\bar{y}替代。

\chi ^{2}=\sum_{i}^{n}(\frac{y_{i}-\bar{y}}{\sigma})^{2} =\frac{1}{{\sigma}^{2}}\sum_{i}^{n}({y_{i}-\bar{y})^2} =\frac{(n-1)s^{2}}{\sigma ^{2}}=\frac{\upsilon s^{2}}{\sigma ^{2}}

这一分布的自由度为独立的正态离差的个数,此处v=n,其分布图形为一组具不同自由度v值的曲线。\chi ^{2}值最小为0,最大为\infty,因而在坐标轴的右面。自由度小时呈偏态,随着自由度增加,偏度降低,至+\infty时,呈对称分布。该分布的平均数为v,方差为2v。

                                        

K.Pearson根据\chi ^{2}的定义从属性性状的分布推到用于次数资料(计数资料)分析的\chi ^{2}公式

\chi ^{2}是多项u_{i}^{2}或(o-e)^2/e之和,\chi ^{2}具有可加性。

二、\chi ^{2}在方差同质性测验中的应用

在连续性变数的分析中常用以方差的比较,并用以估计总体的方差\sigma ^{2}。一个样本方差与总体方差的比较和二样本方差的比较可用F测验,多个样本间方差的比较须用\chi ^{2}测验。

(1)一个样本方差与给定总体方差比较的假设测验

测验单个样本方差s^{2}其所代表的总体方差和给定的总体方差值C是否有显著差异,简称一个样本与给定总体方差的比较。

两尾测验:H0:\sigma ^{2}=C 显著大于和小于C的\chi ^{2}值是>\chi _{(\alpha /2),v}^{2}和<\chi _{(1-\alpha /2),v}^{2}                                                                   

一尾测验:测验样本总体方差是否大于给定总体方差C。H0:\sigma ^{2}\leqC,显著时\chi ^{2}值是>\chi _{(\alpha /2),v}^{2}

从抽样分布可知,方差的抽样分布是不对称的。由卡方的定义\chi ^{2}=\frac{\upsilon s^{2}}{\sigma ^{2}},应用\chi ^{2}分布由样本s^{2}给出总体\sigma ^{2}的置信区间。

                               

置信限是不对称的,即从L1到s^{2}的距离不等于L2到s^{2}的距离。可利用置信限做显著性测验,也可算出标准差的置信限。

一般n\leq30,单个样本方差用卡方分布来测验和推断置信区间

一般n>30,卡方分布近似对称,sqrt(2\chi ^{2})-sqrt(2v-1)近似服从N(0,1)分布,可用u测验并进行区间估计

两样本间方差比较可用卡方测验,方法是对两个样本分别估计出其总体方差的置信区间,若两者不重叠便有显著差异,F测验更方便。

(2)几个样本方差的同质性测验

假定有3个及以上的样本,每一样本均可估得一方差,则由卡方可测验各样本方差是否来自相同方差总体的假设,这称为方差的同质性测验(test for homogeneity among variances)

H0:\chi^{2}=\sigma_{1}^{2}=\sigma_{2}^{2}=\sigma_{i}^{2}=...=\sigma_{k}^{2}(k为样本数) H_{A}:\sigma_{1}^{2},\sigma_{2}^{2},\sigma_{i}^{2},...,\sigma_{k}^{2}不全相等。这一测试方法由Bartlett式(1937)提出,是一种近似\chi ^{2}测验。

上述的\chi ^{2}值若不用C矫正,亦近似做\chi ^{2}分布,不论矫正与否均具有v=k-1;若所得\chi ^{2}值不显著,则不必再做矫正,接受无效假设;\chi ^{2}值接近\fn_phv \chi _{\alpha,v}^{2},应作矫正。\chi ^{2}>\fn_phv \chi _{\alpha,v}^{2},否定原假设,表明这些样本所属总体方差不是同质的。

三、适合性测验(tset for goodness of fit )

\chi ^{2}测验用于计数资料。

四、独立性测验(test for independence)

主要探求两个变数间是否相互独立。

猜你喜欢

转载自blog.csdn.net/mengjizhiyou/article/details/82020445