第三节数据降维 - 代码天地

第三节数据降维

其他 2020-03-25 15:50:47 阅读次数: 0

# 特征选择的原因：部分特征的相关度高，容易消化计算性能，部分特征对预测结果会产生噪声
# filter（过滤式）：variancethreshold，即从方差大小考虑
# embedded（嵌入式）：正则化、决策树，
# wrapper（包裹式）：
# 主成分分析：PCA本质是一种分析、简化数据集的技术，目的是将数据维度压缩，以损失少量信息为代价，尽可能降低源数据的维度，适合维度达到上百的时候

from sklearn.feature_selection import VarianceThreshold

def var():
    '''过滤方差，进行降维'''
    # threshold指定要过滤的方差，小于等于即过滤该特征
    var = VarianceThreshold(threshold=0.0)

    data = var.fit_transform([[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]])

    print(data)


if __name__ == "__main__":
    var()

from sklearn.decomposition import PCA

def pca():
    '''主成分分析进行降维'''
    # n_components等于小数时，表示保留百分之几的信息（一般经验是0.9-1之间），填整数表示保留多少个特征
    pca = PCA(n_components=0.9)
    data = pca.fit_transform([[2, 8, 4, 5,], [6, 3 ,0, 8], [5, 4, 9, 1]])
    print(data)


if __name__ == "__main__":
    pca()

猜你喜欢

转载自www.cnblogs.com/kogmaw/p/12566603.html

第三节数据降维

第三节数据与编码

第三节-内置数据结构

我的数据库第三节

EasyUI 数据表格（DataGrid）——第三节

第三节 ElasticSearch数据导入之Logstash

第三节：数据库

SQL语句第三节：排序检索数据

第三节数据通信基础

第三节容器数据卷

【软件构造】第三章第三节抽象数据型(ADT)

软件构造第三章第三节抽象数据型(ADT)

【大数据入门笔记系列】第三节 Hdfs写数据处理流程

高级数据结构（第三节课）__2018.7.15

Hadoop大数据入门到实战（第三节） - HDFS文件系统

java基础-基本数据类型（第三节）

大数据理论课（第三节----利用Matplotlib绘制各类图像）

第三节查询数据库并显示列表

第三节：Centos下安装Mysql5.6数据库

第三节——数据库连接池与JDBC Template

数据库的基本操作：第三篇查，修，添，删（第三节：添）

第三节：大数据协作框架 - Sqoop、Flume、Oozie《01->数据转换工具Sqoop》

分布式事务数据库 —-MySQL 数据库开发规范(第三节)

第一章第三节（C++语言的基本数据类型与存储形式）

go语言高端技术学习系列教程：第三节Get、Post、Put等请求及数据返回格式

大数据理论课（第三节----菜单栏制作+直方图绘制+pandas的使用）

第三节

第三节：

余老师带你学习大数据-Spark快速大数据处理第三章第三节HDFS基本操作

余老师带你学习大数据-Spark快速大数据处理第六章第三节Spark环境搭建

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)