在进行机器学习模型训练的时候,数据预处理也是很大一块工作,也是面试官常喜欢考的一部分内容,因此对于常用的数据预处理的方法,也是需要我们必须要掌握的内容:
我们需要知道,在进行数据预处理时候,我们常用的数据包为numpy和pandas
1.常用的数据预处理工具
2.数据缺失的处理方法
3.训练集与测试集的划分方法及具体实现
4.pandas数据缺失填充的函数为什么
大概目前遇到的问题就这些,先放在这里,后续我填充具体的回答~
===========
我是晶心,一个努力进阶的程序媛,欢迎我们一起交流学习~
也欢迎关注我~
===========