数据预处理中的标签提取和数据分类 - 代码天地

数据预处理中的标签提取和数据分类

企业开发 2023-09-15 18:23:21 阅读次数: 0

处理的是.csv文件，首先要做的是读取.csv文件中的表格数据，使用的是pandas中的read_csv函数。

那么问题来了，这样读取文件返回值是什么呢？

我们来输出一下：

发现是DataFrame类型的数据，那么这个数据类型到底是什么呢？

经过查找资料，菜鸟教程上是这么解释的：DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔型值）。DataFrame 既有行索引也有列索引，它可以被看做由 Series 组成的字典（共同用一个索引）。

Pandas 数据结构 – DataFrame | 菜鸟教程 (runoob.com)

那么问题来了，我也不是很记得Series和字典这两种数据结构，继续学习。

数据结构 - Series：

Pandas 数据结构 – Series | 菜鸟教程 (runoob.com)

数据结构 - 字典：花括号

Python 字典(Dictionary) | 菜鸟教程 (runoob.com)

接下来要将表格根据标签将数据分开，因为有的标签数据太少了，需要扩充标签数据。

由于数据集的标签数据在最后一列，所以用numpy中的shape[1]来读取列数，shape[0]读取的是行数，对于二维数据来说。shape[1]-1就是列索引号，因为索引号从0开始。

需要将标签提取成一个无序不重复元素集，先使用iloc函数将标签列全部提取出，values去掉索引，ravel将多维数组转化为一维数组，然后使用set函数创建一个无序不重复元素集。

把数据按标签分开就是：

标签数据组的索引为索引，在新的数组中把该标签的数据全部添加进去，然后把新的数据按照标签号以DataFrame数据类型重新保存成.csv文件。

猜你喜欢

转载自blog.csdn.net/qq_46012097/article/details/129280474

数据预处理中的标签提取和数据分类

说话人识别中的数据预处理和数据增强

数据预处理：分类变量实体嵌入做特征提取

《python数据分析和数据挖掘》——数据预处理

Scikit-learn数据预处理分类变量编码之多标签二值化

Scikit-learn数据预处理分类变量编码之标签二值化

文本分类的数据预处理[转]

预处理数据打标签相关工具

数据预处理1--ETL和数据清洗

数据和数据预处理（ML&DM）

sklearn 数据集划分和数据预处理

Pytorch数据操作和数据预处理

sklearn中的数据预处理

ML中的数据预处理

【数据预处理】数据降维和特征提取

不同模型和数据预处理技术的性能比较

数据预处理、降维、特征提取及聚类

数据预处理_标准化和分类数据转换

图像处理（1）：PyTorch垃圾分类数据预处理

图像处理（1）：PyTorch垃圾分类数据预处理

机器学习中的特征工程和数据预处理技术是什么？如何处理缺失值和异常值？

数据——数据预处理

自己动手做 chatgpt:seq2seq翻译模型中GRU模块的原理和数据预处理

跨语言情感分类之数据预处理

CNN英文垃圾邮件分类（数据预处理）

神经网络在多分类上的应用——数据预处理

文本分类(一) | (2) 数据集及预处理

文本分类(三) | (3) 数据预处理

深度学习中的数据预处理

深度学习中的数据预处理方法

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)