在使用pandas读入相关的excel后,若是表格中有空值的列,要如何清洗呢
在查阅了网上的相关的资料后,得到了办法
pandas.dropna(axis=1,how=‘any’)
axis=0指行,若是参数中不写,则是默认为axis=0,
axis=1则是指列
how=‘any’则是指只要列中含有一个空值,就删除该列
how='all’则是代表只有一整列为空值,才删除该列
需要注意的是在python3.7的版本里
使用pandas.dropna需要有一个变量来接收返回值
否则在运行程序的时候 不会报错 但数据也不会发生改变
再写一些pandas库中关于excel表格的操作
#encoding=gb18030
import numpy
import pandas as pd
data_filename = "data/data21695/数据.xlsx"
df = pd.read_excel(data_filename)
x = df.dropna(axis=1,how='any')
g=df["编号"]
y = len(g)
i=0
print(y)
del x["无机盐"]
x["无敌"]=x["身高"]
for i in range(y):
x.iloc[i,0]=i
x.to_excel('new.xlsx')
pandas.read_excel 读入excel表格
del[‘无机盐’] 删除名为无机盐的列
x[‘无敌’]=x[‘身高’] 添加一列名为无敌,将身高这一列的数据复制到无敌这一列
x.iloc[i,0] 获取第i行,第0列的数据
x.to_excel 导入至名为new.xlsx的excel表格中