##LabelEncoder、pd.get_dummies哑编码与one-hot的区别 https://blog.csdn.net/lanchunhui/article/details/72870358
只能对单列操作,如何扩展到多列,进行编码?
##LabelEncoder与one-hot的区别
https://blog.csdn.net/lanchunhui/article/details/72870358
https://blog.csdn.net/mvpboss1004/article/details/79188190
https://blog.csdn.net/lujiandong1/article/details/52836051
##http://m.blog.csdn.net/gao1440156051/article/details/55096630
##get_dummies的利与弊
1、get_dummies 不像 sklearn 的 transformer一样,有 transform方法,所以一旦测试集中出现了训练集未曾出现过的特征取值,简单地对测试集、训练集都用 get_dummies 方法将导致数据错误。
2、不是 sklearn 里的transformer类型,所以得到的结果得手动输入到 sklearn 里的相应模块,也无法像 sklearn 的transformer一样可以输入到pipeline中 进行流程化地机器学习过程。