R语言差异检验：t检验

文章目录

@[toc]

单样本t检验

适用条件

具体计算公式

R语言示例

独立样本t检验

适用条件

具体计算公式

R语言示例

配对样本t检验

适用条件

具体计算公式

R语言示例

t检验(student t检验)是应用t分布的特征，将t作为检验的统计量来进行统计推断方法。它对样本要求较小(例如n＜30)。

主要用途：

样本均数与总体均数的差异比较
两样本均数的差异比较

分类：

单样本t检验
独立样本t检验
配对样本t检验

单样本t检验

单样本t检验主要用于判断样本均数与总体均数是否存在显著差异。

适用条件

已知一个总体均数
已知一个样本均数及该样本标准差
样本正态分布或近似正态总体

实际应用中，当数据量足够大时，对样本正态分布要求不再严格。只要数据分布不是严重偏态，一般来说单样本t检验都是适用的。

具体计算公式

$t=\frac{\bar{x}-μ_0}{s/\sqrt{n}}$

$自由度df=n-1$
其中， $\bar{x}$ 为样本均数、 $\mu_0$ 为总体均数， $s$ 为样本标准偏差、 $n$ 为样本数。该统计量t在原假设 $\mu=\mu_0$ 为真的条件下服从自由度为 $n-1$ 的t分布。

R语言示例

R语言中可以用t.test函数进行t检验

(虚构)从某小学六年级抽取10名学生，其身高(单位：cm),是否认为该学校六年级平均身高130cm?

10名学生身高：
130,120,130,110,130,135,129,124,130,134

#生成数据
x <- c(130,120,130,110,130,135,129,124,130,134)
#t检验
t.test(x,mu = 130)

	One Sample t-test

data:  x
t = -1.1884, df = 9, p-value =
0.2651
alternative hypothesis: true mean is not equal to 130
95 percent confidence interval:
 121.8702 132.5298
sample estimates:
mean of x 
    127.2 
#结果显示，P=0.2651＞0.05。在统计学上说明样本均数与总体均数没有差别。

独立样本t检验

独立样本t检验主要检验两个样本均数及其所代表的总体之间差异是否显著。

适用条件

独立性，各观察值之间相关独立
正态性，各样本均来自正态分布的总体
方差齐性，各样本所在总体的方差相等

具体计算公式

方差齐性条件下下
$s_c^2=\frac{s_1^2(n_1-1)+s_2^2(n_2-1)}{n_1+n_2-2}$
$t=\frac{\bar{x_1}-\bar{x_2}}{s_{\bar{x_1}-\bar{x_2}}}=\frac{\bar{x_1}-\bar{x_2}}{\sqrt{s_c^2(1/n_1+1/n_2)}}$
$v=(n_1-1)+(n_2-1)=n_1+n_2-2$
其中， $v$ 为自由度
方差不齐条件下
$t^{’}=\frac{\bar{x_1}-\bar{x_2}}{\sqrt{{\frac{S_1^2}{n_1}}+{\frac{S_2^2}{n_2}}}}$
$v=\frac{{(S_1^2/n_1+S_2^2/n_2)^2}}{{\frac{(S_1^2/n_1)^2}{n_1-1}}+{\frac{(S_2^2/n_2)^2}{n_2-1}}}$

R语言示例

独立样本t检验需要检验其适用条件，主要是指方差齐性，其他条件：样本独立性一般数据可以保障。t检验对样本正态性具有一定耐受性。

方差齐性可以用car包leveneTest函数检验

leveneTest(y=,group =)

其中，y是两组样本组成的数据，group是两组样本的分组情况。

方差齐性检验之后，才可进行独立样本t检验。

用t.test(A,B,var.equal=TRUE，paired=FALSE)

A、B为数据集，var.equal=TRUE为方差齐性。paired=FALSE非配对样本。

示例：

(虚构)有两组学生(每组10人)，一组采用传统教育，一组采用素质教育。一学期后，两组学生语文成绩(满分100)如下。问两组学生成绩之间差别是否显著。

传统组A
85,84,95,73,77,65,85,93,90,91
素质组B
87,96,77,80,79,96,93,82,84,86

A <- c(85,84,95,73,77,65,85,93,90,91)
B <- c(87,96,77,80,79,96,93,82,84,86)
#方差齐性检验
#合并数据
y <- c(A,B)
#数据分组标签
group=as.factor(c(rep(1,10),rep(2,10)))
#载入car包
library(car)
#方差齐性检验
leveneTest(y=y,group = group)
#结果显示，P=0.5505＞0.05。说明方差齐性。
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  1  0.3703 0.5505
      18  
#独立样本t检验
t.test(A,B,paired = FALSE)
#结果显示P=0.5639。说明两者没有区别。
	Welch Two Sample t-test

data:  A and B
t = -0.589, df = 16.463, p-value = 0.5639
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -10.100024   5.700024
sample estimates:
mean of x mean of y 
     83.8      86.0

配对样本t检验

配对样本t检验同样检验两个样本均数及其所代表的总体之间差异是否显著。

独立样本t检验与配对样本t检验同属于双样本t检验，不同点在于配对样本t检验要求两个样本之间存在某些配对关系。

常见配对关系：

同一样本两种不同处理方法的检验结果
同一样本前后时间点的检验结果

适用条件

正态性

具体计算公式

$t=\frac{\bar{d}-0}{s_{\bar{x}}}=\frac{\bar{d}}{s/\sqrt{n}}$
$df=n-1(n为配对数目)$

R语言示例

配对样本t检验用t.test函数完成。

t.test(x,y,paired=TRUE)

其中，x、y为数据，paired=TRUE是配对数据

示例：
有20名女性分为10对，试吃两种药。经过一段时间后，药效如下。问两种药是否有区别

药1

4.4,5,5.8,4.6,4.9,4.8,6,5.9,4.3,5.1

药2

6.2,5.2,5.5,5,4.4,5.4,5,6.4,5.8,6.2

#生成数据
drug1 <- c(4.4,5,5.8,4.6,4.9,4.8,6,5.9,4.3,5.1)
drug2 <- c(6.2,5.2,5.5,5,4.4,5.4,5,6.4,5.8,6.2)
#配对样本t检验
t.test(drug1,drug2,paired = TRUE)
#结果显示，P=0.1575＞0.05,不能说两者存在显著差别。
	Paired t-test

data:  drug1 and drug2
t = -1.5417, df = 9, p-value = 0.1575
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -1.0609306  0.2009306
sample estimates:
mean of the differences 
                  -0.43

$R语言小白速通$
$懂点R语言$
$欢迎分享收藏关注$

R语言小白速通

发布了38 篇原创文章 · 获赞 13 · 访问量 3297

私信关注