数据预处理-数据转换

转换方法 具体内容
meanstd (x-mean)/std
minmax   ( x-min)/max
max  x/max(x)
binary 二值化,设定一个阈值,sklearn支持
onehot编码 参考:https://www.cnblogs.com/daguankele/p/6595470.html
分位数转换 以分为点来替代
缺失值填补 一般用均值
生成多项式特征 sklearn 支持只保留交叉项



参考:http://cwiki.apachecn.org/pages/viewpage.action?pageId=10814134



猜你喜欢

转载自blog.csdn.net/huangqihao723/article/details/80772494