征服统计学07|什么是协方差?什么是相关系数?

本文介绍协方差和相关系数

本文目录

协方差

协方差描述变量之间关系

协方差VS相关系数

方差VS协方差

相关系数

相关系数量化相关性的强度

p值及数据量衡量相关系数

Reference


协方差

协方差描述变量之间关系

  • 协方差(Covariance)主要用于描述变量之间的以下三类关系

扫描二维码关注公众号,回复: 12941699 查看本文章

正相关关系,例如上图,同一细胞中Gene X表达量与Gene Y表达量成正相关。

此时协方差为正。

负相关关系,例如上图,同一细胞中Gene X表达量与Gene Y表达量成负相关。

此时协方差为正。 


无相关关系,此时Gene X表达量与Gene Y表达量无趋势关系。

此时协方差为零。


协方差VS相关系数

  • 协方差(Covariance)另一个作用在于辅助其它统计计算,如相关系数(correlation)。

如上图,协方差可描述变量的相关性类别(正/负/无相关性),但对数据的取值范围非常敏感,不能用于描述变量之间的相关性程度(若正相关,正相关斜率为多大等);

而相关系数对数据取值范围不敏感,可用来描述变量之间的相关性程度。


方差VS协方差

方差为协方差的一种特殊模式,描述某个变量与本身之间的关系,由下图公式可非常容易理解。


相关系数

相关系数计算公式如上图,依赖两变量协方差及各变量的方差,这也回答了上一节所说的协方差辅助计算相关系数。

相关系数量化相关性的强度

弱相关性对应较小的相关系数。

强相关性对应较大的相关系数。

相关系数值域在[-1,1]之间,-1表示最强负相关,1表示最强正相关,0表示不相关。

p值及数据量衡量相关系数

收集的数据越多,p值越小,推测出的相关系数越可信


Reference

猜你喜欢

转载自blog.csdn.net/qq_21478261/article/details/112069370