csv文件中某列数据替换为数字
来源——机器学习读取数据
方法一:正则表达式,replace()
import pandas as pd
data = pd.read_csv("data2.csv")
print(data)
# 用户编号 性别 年龄(岁) 年收入(元) 是否购买
# 0 15624510 Male 19 19000 0
# 1 15810944 Male 35 20000 0
# 2 15668575 Female 26 43000 0
# 3 15603246 Female 27 57000 0
# 方法一:replace
data.replace("Male",1,inplace=True)
data.replace("Female",2,inplace=True)
print(data)
# 用户编号 性别 年龄(岁) 年收入(元) 是否购买
# 0 15624510 1 19 19000 0
# 1 15810944 1 35 20000 0
# 2 15668575 2 26 43000 0
# 3 15603246 2 27 57000 0
方法二:map()
import pandas as pd
data = pd.read_csv("data2.csv")
gender = {'Male':1,'Female':2}
data["性别"] = data["性别"].map(gender)
print(data)
# 用户编号 性别 年龄(岁) 年收入(元) 是否购买
# 0 15624510 1 19 19000 0
# 1 15810944 1 35 20000 0
# 2 15668575 2 26 43000 0
# 3 15603246 2 27 57000 0
另补充:方法二是在原有的基础上直接将csv表格中的数据更改,若需要生成一列新的数据,则有: