python数据分析数据的去重,缺失值的处理 - 代码天地

python数据分析数据的去重,缺失值的处理

其他 2021-04-04 13:12:06 阅读次数: 0

1.1重复值的查看,带参数可以传入列,也可以不带:
df.duplicated(subset=" ")

1.2重复值的处理(删除)

删除整体数据的重复值,每个字段都一样的行

带参数inplace=True改变原始数据,不带参数默认不改变
df.drop_duplicates(inplace=True)
按照某几列去重,是个列表的形式传入不同的列名:
df.drop_duplicates(subset = [ " " , " " ])
删除后的保留行keep参数:
keep参数默认留重复的第一行,也可以保留最后一行
传入参数keep = "last"
传入keep = "False"时候把重复值全部删除,不做保留

2.1缺失值的查看:

有没有缺失值
df.isnull()
不缺失数据
~df.isnull()
查看哪列有缺失值
df.isnull().any(axis=0)
查看缺失值的个数
df.isnull().sum(axis=0)
查看缺失值的比例
df.isnull().sum(axis=0)/df.shape[0]
2.2缺失值的处理(填充)

df1.fillna(0)
fillna（0）填充所有空白为0
按列名填充相应的值,盲目添加
df.fillna({"性别":"男","年龄":"10"})
按照不同方式填充缺失值----性别众数填充,年龄平均值填充,收入中位数填充
df.fillna(value={"sex":df["sex"].mode()[0],"age":df["age"].mean(),"income":df["income"].median()})

2.3缺失值的处理(删除):

df.dropna()
dropna删除有缺失的行
df.dropna(how = 'all')
how = 'all'删除全部为空的行

猜你喜欢

转载自blog.csdn.net/sunjiaxing_1/article/details/106087760

python数据分析数据的去重,缺失值的处理

【Python数据分析基础】: 数据缺失值处理

python数据分析之清洗数据：缺失值处理

Python数据分析基础: 数据缺失值处理

Python数据分析（二）pandas缺失值处理

python大数据分析——缺失值处理

Python数据分析实战：缺失值处理

数据分析中的缺失值处理

数据分析处理缺失值

数据分析—缺失值处理

数据分析之缺失值处理

数据分析——数据清洗之缺失值处理

Python数据分析中对重复值、缺失值、空格的处理

数据分析中缺失值处理~R语言

数据分析03_Pandas处理缺失值

【数据分析】重要环节--缺失值怎么处理

pandas数据分析之缺失值处理

【python数据分析】利用pandas处理缺失数据

【Python数据分析】pandas去重和替换

Pandas数据分析17——pandas数据清洗(缺失值、重复值处理)

【python】数据挖掘分析清洗——缺失值处理方法汇总

Python 数据分析三剑客之 Pandas（三）：算术运算与缺失值的处理

数据分析之Pandas（七）高级处理-缺失值处理

数据分析学习总结笔记05：缺失值分析及处理

Python 数据处理缺失值处理

《利用Python进行数据分析》第5章 pandas的数据汇总与处理缺失数据

python处理缺失数据、过滤，填补-----python进行数据分析

数据分析笔记--pandas处理缺失数据

数据分析学习笔记4-----处理缺失数据

pandas数据分析-处理填充缺失数据

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)