基于sklearn的序列处理 : LabelEncoder 与 OneHotEncoder - 代码天地

基于sklearn的序列处理 : LabelEncoder 与 OneHotEncoder

其他 2018-09-17 08:20:47 阅读次数: 0

版权声明：有错误还请斧正，感激不尽。 https://blog.csdn.net/Gentle_Guan/article/details/78698259

LabelEncoder

直接上代码

# coding:utf-8

from sklearn import preprocessing

label_encode = preprocessing.LabelEncoder()  # 建立模型
label_encode.fit([['-1'], [13], [456],['a']])
# label_encode.transform([1]) # 错误 不可无中生有
print label_encode.transform([[13], [456], ['a']])  # 训练模型 数据转换
"""
[1 2 3]
"""
print label_encode.inverse_transform(2)  # 数据逆向转换
"""
456
"""

OneHotEncoder

# coding:utf-8

from sklearn import preprocessing

label_onehot = preprocessing.OneHotEncoder()
# label_onehot.fit([[-1],[13],[456]]) # 错误 不可出负数
label_onehot.fit([[1], [13], [456]])
print label_onehot.transform([[1], [13], [12]]).toarray() # 无中生有 全为0 (类似于噪声？
"""
[[ 1.  0.  0.]
 [ 0.  1.  0.]
 [ 0.  0.  0.]]
"""
print label_onehot.transform([[1], [13], [456]]).toarray()
"""
[[ 1.  0.  0.]
 [ 0.  1.  0.]
 [ 0.  0.  1.]]
"""
print type(label_onehot.transform([[1], [13], [456]])),"\n",label_onehot.transform([[1], [13], [456]])
"""
<class 'scipy.sparse.csr.csr_matrix'> 
  (0, 0)    1.0 
  (1, 1)    1.0
  (2, 2)    1.0 这里的输出为 坐标 填充数字 比对着上一个输出看
"""

比较

两个差别都在代码里了
对于非负数类型编码利用onehotEncode
对于字符以及混合类型编码利用labelEncode

猜你喜欢

转载自blog.csdn.net/Gentle_Guan/article/details/78698259

基于sklearn的序列处理 : LabelEncoder 与 OneHotEncoder

Sklearn中LabelEncoder与OneHotEncoder

LabelEncoder & OneHotEncoder

python数据预处理之LabelEncoder()、OneHotEncoder()

sklearn 处理文本和分类属性[LabelBinarizer, LabelEncoder,OneHotEncoder]

LabelEncoder和OneHotEncoder

onehotencoder和labelencoder小结

OneHotEncoder和LabelEncoder的区别

python 数据处理中的 LabelEncoder 和 OneHotEncoder

使用sklearn进行数据预处理之Binarizer,LabelEncoder,LabelBinarizer,OneHotEncoder

sklearn中的几种二值化编码函数：OneHotEncoder, LabelEncoder , LabelBinarizer

特征为分类变量时，进行编码处理——pd.get_dummies()、oneHotEncoder()、LabelEncoder()

数据预处理之将类别数据数字化的方法 —— LabelEncoder VS OneHotEncoder

sklearn onehotencoder()

机器学习：数据预处理之将类别数据数字化的方法 —— LabelEncoder VS OneHotEncoder

OneHotEncoder独热编码和 LabelEncoder标签编码

OneHotEncoder独热编码和LabelEncoder标签编码

【373】LabelEncoder 相关 OneHotEncoder独热编码和 LabelEncoder标签编码

sklearn--processing--labelencoder

OneHotEncoder

离散数据编码方式的总结(OneHotEncoder、LabelEncoder、OrdinalEncoder、get_dummies、DictVectorizer的区别？)

sklearn preprocessing 数据预处理 OneHotEncoder

sklearn preprocessing 数据预处理（OneHotEncoder）

python：sklearn 标签编码（LabelEncoder）

sklearn.preprocessing.OneHotEncoder()函数介绍

11.sklearn.preprocessing.LabelEncoder的作用

ML2: Sklearn.preprocessiong LabelEncoder()

用sklearn.preprocessing做数据预处理（四）——OneHotEncoder

【Q001】sklearn的LabelEncoder使用问题处理

特征处理： OneHotEncoder 与 pandas.get_dummies

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)