为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,便于进行综合分析。
1、最大-最小标准化
也称为离差标准化。公式为:
2、零-均值标准化
也称为标准差标准化。经过处理的数据的均值为0,标准差为1。公式为
R语言中可以用scale()函数实现。
3、小数定标标准化
通过移动数值的小数位数,将数值映射到[-1,1],移动的小数位数取决于数值绝对值的最大值。公式为
R语言实现:
k = ceiling(log(max(abs(data)),10)) #计算移动的小数位数
x = data/10^k