数据处理之标准化(R语言)

    为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,便于进行综合分析。

1、最大-最小标准化

也称为离差标准化。公式为:

x_{*} = \tfrac{x-min}{max-min}

2、零-均值标准化

也称为标准差标准化。经过处理的数据的均值为0,标准差为1。公式为

x_{*} = \tfrac{x-\bar{x}}{\sigma }

R语言中可以用scale()函数实现。

3、小数定标标准化

通过移动数值的小数位数,将数值映射到[-1,1],移动的小数位数取决于数值绝对值的最大值。公式为

x_{*} = \tfrac{x}{{_{10}}^{k}}

R语言实现:

k = ceiling(log(max(abs(data)),10)) #计算移动的小数位数

x = data/10^k

猜你喜欢

转载自blog.csdn.net/zjlamp/article/details/81367680