机器学习入门（四）：特征工程——特征降维 - 代码天地

机器学习入门（四）：特征工程——特征降维

其他 2021-03-22 19:55:07 阅读次数: 0

特征工程
一.为什么需要特征工程？
因为“数据和特征决定机器学习的上限，而模型和算法只是逼近这个上限而已”，使用专业背景知识和技巧处理数据，使算法变得更好。
二.什么是特征工程
sklearn库用于做特征工程
pandas库用来做数据清洗、数据处理。

特征降维

定义：降低特征的个数（降低列数），得到一组“不相关”的主变量得过程

方法一：特征选择
         1.Filter（过滤式）：主要探究特征本身特点、特征与特征和目标值之间得关联
                  ①方差选择法：低方差特征过滤
                  ②相关系数法：衡量特征与特征之间的相关程度
         2.Embedded（嵌入式）：算法自动选择特征（特征与目标值之间的关联）
                  ①决策树：信息熵、信息增益
                  ②正则化：L1、L2
                  ③深度学习：卷积等

特征选择定义：数据中心包含冗余或相关变量，旨在原有特征中找出主要特征
1.Filter（过滤式）
       ①方差选择法：低方差特征过滤
       原理：特征的方差小，说明某个特征的样本值比较相似，则删掉低方差特征；特征的方差大，说明某个特征的样本值差别大，则保留高方差特征。
在这里插入图片描述
         ②相关系数法

当特征与特征之间相关系数很高时：
（1）保留其中一个
（2）加权求和
（3）主成分分析

方法二：主成分分析（PCA）

在这里插入图片描述
例如：给定五个点，画到明面直角坐标系中，是个二维的，我们使用主成分分析给降到一维：

案例：探究用户对物品类别的喜好细分降维

在这里插入图片描述
处理流程：

读取四个表：

将ueser_id和aisle_id合并：

找到ueser_id和aisle_id之间的关系：

取前一万个数据。由于0太多了，冗余太多了，进行PCA降维：

猜你喜欢

转载自blog.csdn.net/qq_45234219/article/details/114821567

机器学习入门（四）：特征工程——特征降维

[机器学习]特征工程：特征降维

机器学习基础之《特征工程（4）—特征降维》

【机器学习】特征降维

机器学习-特征降维

【机器学习】特征降维-特征选择

机器学习特征工程之数据降维

【机器学习之特征工程】数据预处理、特征选择、降维及不平衡处理

机器学习基础之《特征工程（5）—特征降维—案例》

Python机器学习及实践——特征降维

机器学习（七）特征降维

07 特征工程 - 特征降维 - PCA

特征工程——数据降维

特征工程之降维

【特征工程】数据降维

面向机器学习的特征工程六、降维：用 PCA 压缩数据集

机器学习（四）降维之NMF及人脸特征提取

机器学习笔记——降维（特征提取）

机器学习算法（九）特征降维——PCA 与 LDA

机器学习15-特征降维PCA

机器学习实践（五）—sklearn之特征降维

【机器学习】特征降维-主成分分析

【机器学习】特征降维 - 方差选择法VarianceThreshold

【机器学习】特征降维 - 主成分分析PCA

简单粗暴理解与实现机器学习之聚类算法（六）：【特征工程】-特征降维、特征选择、主成分分析(PCA)、案例

四、机器学习中的特征工程

机器学习（四）特征工程介绍

机器学习入门（三）：特征工程——特征预处理

机器学习入门（二）：特征工程——特征抽取

机器学习—特征工程

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)