one-hot的几种操作方式

##LabelEncoder、pd.get_dummies哑编码与one-hot的区别 https://blog.csdn.net/lanchunhui/article/details/72870358

只能对单列操作,如何扩展到多列,进行编码?

##LabelEncoder与one-hot的区别

https://blog.csdn.net/lanchunhui/article/details/72870358

https://blog.csdn.net/mvpboss1004/article/details/79188190

https://blog.csdn.net/lujiandong1/article/details/52836051

##http://m.blog.csdn.net/gao1440156051/article/details/55096630

##get_dummies的利与弊

1、get_dummies 不像 sklearn 的 transformer一样,有 transform方法,所以一旦测试集中出现了训练集未曾出现过的特征取值,简单地对测试集、训练集都用 get_dummies 方法将导致数据错误。

2、不是 sklearn 里的transformer类型,所以得到的结果得手动输入到 sklearn 里的相应模块,也无法像 sklearn 的transformer一样可以输入到pipeline中 进行流程化地机器学习过程。

猜你喜欢

转载自my.oschina.net/kyo4321/blog/1819592