import pandas as pd
import numpy as np
df=pd.DataFrame(np.random.rand(10,6) )
df.iloc[1:3,2]=np.nan
df.iloc[4,5:6]=np.nan
df.iloc[5,6:7]=np.nan
# isnull 对df的每个值进行判断,返回true or false
#print(df.isnull())
# isnull().any() 判断哪几列有null值
#print(df.isnull().any())
# 判断哪些行存在缺失值
#print(df.T.isnull().any())
# 只显示存在缺失的行
#print(df[df.isnull().values==True])
#print(df[df.isnull().values==True].index)
#缺失值处理-丢弃 dropna()
#print(df.dropna(axis=1)) # axis=1 表示丢弃列后的df 默认 axis=0,丢弃行
# 填充
#print(df.fillna(0))
#print(df.fillna(df.mean(axis=0)))
#print(df)
#print(df.fillna(method='pad')) # 用前一个数进行替换,缺失值同列上一行的数字进行补充
#print(df.fillna(method='bfill')) # 同列下一行的数字进行补充
print(df.fillna(df.interpolate())) #插值填充
pandas-缺失值处理
猜你喜欢
转载自blog.csdn.net/huangqihao723/article/details/82193783
今日推荐
周排行