对该数据集的字段请对该数据集的字段absence进行二值化处理

请对该数据集的字段absence进行二值化处理,超过8次的记为1,不超过8次的记为0,将处理后的结果存为该数据集的新列new_absence

提示:可以使用sklearn.preprocessing中的Binarizer函数实现上述功能

import pandas as pd
data = pd.read_csv('newdata.csv')
print(data[['absences']].head())

# 二值化转换
from sklearn import preprocessing
binarizer = preprocessing.Binarizer(threshold=8)
data['new_absences'] = binarizer.transform(data[['absences']])
 
print(data[['new_absences']].head())

猜你喜欢

转载自blog.csdn.net/weixin_44039266/article/details/106074166