数据预处理——标准化、归一化、正则化 - 代码天地

数据预处理——标准化、归一化、正则化

其他 2018-11-06 21:48:15 阅读次数: 0

三者都是对数据进行预处理的方式，目的都是为了让数据便于计算或者获得更加泛化的结果，但是不改变问题的本质。

标准化（Standardization）

归一化（normalization）

正则化（regularization）

归一化

我们在对数据进行分析的时候，往往会遇到单个数据的各个维度量纲不同的情况，比如对房子进行价格预测的线性回归问题中，我们假设房子面积（平方米）、年代（年）和几居室（个）三个因素影响房价，其中一个房子的信息如下：

面积(S)：150 平方米
年代(Y)：5 年

这样各个因素就会因为量纲的问题对模型有着大小不同的影响，但是这种大小不同的影响并非反应问题的本质。

为了解决这个问题，我们讲所有的数据都用归一化处理至同一区间内。

正则化

这篇文章对于正则化的讲解通俗易懂：https://www.zhihu.com/question/20924039

正则化主要用于防止过拟合

我们在训练模型时，要最小化损失函数，这样很有可能出现过拟合的问题（参数过多，模型过于复杂），所以我么在损失函数后面加上正则化约束项，转而求约束函数和正则化项之和的最小值。

上式中，蓝色部分即为损失函数，红色部分是正则化项（参数的2-范数）

标准化

标准化也是将样本的特征转化只同一量纲下的一种方法，标准化的前提是特征值服从正态分布，标准化后，其转换成标准正态分布。

但是在机器学习的数据预处理中，归一化和正则化更为常用。

猜你喜欢

转载自www.cnblogs.com/simpleDi/p/9918306.html

使用sklearn进行数据预处理 —— 归一化/标准化/正则化

使用sklearn数据预处理 —— 归一化/标准化/正则化

Python数据预处理—归一化，标准化，正则化

使用sklearn实现数据预处理 —— 归一化/标准化/正则化

关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

数据预处理——标准化、归一化、正则化

利用sklearn对数据预处理：标准化，归一化，正则化

Python数据预处理 - 归一化与标准化

数据预处理——归一化标准化

机器学习笔记3：数据预处理的规范化，归一化，标准化，正则化

【机器学习】 - 数据预处理之数据归一化(标准化)与实战分析，正则化

【转】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

数据预处理之中心化（零均值化）与标准化（归一化）

一、数据预处理——数据归一化 & 数据标准化

Python数据预处理-数据标准化（归一化）及数据特征转换

Matlab中的数据预处理-归一化（mapminmax）与标准化（mapstd）

数据预处理-归一化与z-score标准化

【实战】数据预处理练习----标准化/归一化/独热化

数据预处理--输入归一化/标准化/放缩

机器学习数据预处理-标准化/归一化方法

Python实现数据预处理--特征标准化与归一化

机器学习之数据预处理——归一化，标准化

【机器学习】数据预处理 - 归一化和标准化

数据标准化（归一化）处理

数据处理：归一化与标准化

数据标准化/归一化

数据归一化（标准化）

数据归一化（标准化）

数据归一化/标准化

数据标准化、归一化

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)