Python数据处理笔记 - 代码天地

Python数据处理笔记

其他 2020-01-21 15:31:02 阅读次数: 0

下面数据的处理方式参考：威斯康辛乳腺癌数据集

1.将数据标签化
也就是将一列数据映射成range范围内的值（标签个数-1）
参考：sklearn.preprocessing.LabelEncoder

2.将数据分成训练集和测试集
参考：sklearn.model_selection.train_test_split

3.数据属性对结果的影响：特征重要性
类标签的影响因素可能有很多属性，但是不同属性对最终结果的影响程度不一样。
在随机森林算法中，有一个参数（feature_importances_）可以通过训练出的模型来显示出每一列对最终结果的影响程度,这个参数只有在以决策树为基础的算法中存在
参考：feature_importances_

4.删除数据中的列
调用pandas包中的drop进行删除，注意调用该函数时，里面的参数inplace,默认情况下是false:不会在原表上进行改变，而是创建一个原表的副本；True:直接改变原表
参考：pandas的drop函数

5.转变数据类型
参考：astype

6.查看该列中都有哪些数据
参考：unique

7.将数组转化成列表
参考：tolist

8.对缺失数据进行填充
参考：fillna

9.取出序列中最大元素的索引
参考：np.argmax

发布了217 篇原创文章 · 获赞 9 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_31672701/article/details/103957429

python 数据处理笔记

Python数据处理笔记

python学习笔记（一）数据处理

数据处理笔记

python数据处理

Python --数据处理

python的数据处理

Python 数据处理

数据处理（python）

数据处理-python

python笔记9:数据处理之缺失值处理

【Python课堂笔记】 Python数据处理(一)

python笔记20:数据处理之数据分组

python笔记7:数据处理之导出数据

python笔记6:数据处理之导入数据

【学习笔记】python数据处理（持续更新）

【python学习笔记】43：Pandas时序数据处理

python笔记21:数据处理之日期转换

数据处理01：Python编程笔记本Jupyter！

python笔记18:数据处理之简单计算

Numpy—笔记1（莫烦python数据处理）

python笔记22:数据处理之时间抽取

python笔记17:数据处理之字段匹配

python笔记16:数据处理之字段合并

python笔记15:数据处理之记录合并

python笔记14:数据处理之随机抽样

python笔记13:数据处理之记录抽取

python笔记12:数据处理之字段拆分

python笔记11:数据处理之字段抽取

python笔记10:数据处理之去除空格

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)