归一化随笔

  1. 数据预处理中,标准的第一步是数据归一化。虽然这里有一系列可行的方法,但是这一步通常是根据数据的具体情况而明确选择的。特征归一化常用的方法包含如下几种:

简单缩放
逐样本均值消减(也称为移除直流分量)
特征标准化(使数据集中所有特征都具有零均值和单位方差)
一般做机器学习应用的时候大部分时间是花费在特征处理上,其中很关键的一步就是对特征数据进行归一化,为什么要归一化呢?很多同学并未搞清楚,维基百科给出的解释:

归一化后加快了梯度下降求最优解的速度;
归一化有可能提高精度;
加快梯度下降求解速度

SVD的应用
奇异值分解
优点:简化数据,去除噪声,提高算法的结果;
缺点:数据的转换可能难以理解;
适用数据类型:数值型数据。

利用SVD实现,我们能够用小得多的数据集来表示原始数据集。这样做,实际上是去除了噪声和冗余信息。当我们试图节省空间时,去除噪声和冗余信息是很崇高的目标,但是在这里我们是从数据中抽取信息。基于这个视角,我们就可以把SVD看成是从有噪声的数据中抽取相关特征。

猜你喜欢

转载自blog.csdn.net/qq_42031483/article/details/89552560