dataframe 拼接、合并、去重、查看数据规模数据预处理合辑 - 代码天地

dataframe 拼接、合并、去重、查看数据规模数据预处理合辑

其他 2020-08-11 10:54:21 阅读次数: 0

拼接不同的表

1、纵向拼接

pd.concat([df1,df2],axis=0)

现有data1.csv和data2.csv

df1 = pd.read_csv('data1.csv',names=['category','theme','URL','content'])
df2 = pd.read_csv('data2.csv',names=['category','theme','URL','content'])
data = pd.concat([df1,df2],axis=0,ignore_index=True) #拼接表格

2、横向拼接

pd.concat([df1,df2],axis=1)

展示数据规模

1、总的行数和列数

print(data.shape)

2、按某一列名统计数量

df = data.groupby('category').count()
print(df)

简单的数据预处理

1、去空行

data = data.dropna(axis=0, how='any')
data = data.drop(index=(data_32.loc[(data_32['content']==' ')].index))

有些空行是啥也没有，这种情况用第一个，有些空行是里面有一个空格，这种情况选用第二个

2、去重，保留第一个

data_2 = data_1.drop_duplicates(keep='first')

3、剔除指定列值所对应的行

data_3 = data_2.drop(index=(data_2.loc[(data_2['现价']=='0.000000')].index))
data = data.drop(data[data['现价']=='0.000000'].index)
data = data[-data["现价"].isin(['0.000000'])]

三种写法都可以

猜你喜欢

转载自blog.csdn.net/Iv_zzy/article/details/107542877

dataframe 拼接、合并、去重、查看数据规模数据预处理合辑

数据分析-合辑

Python数据分析合辑

[数据结构与算法] 学习记录合辑 (06) 查找

[数据结构与算法] 学习记录合辑 (02) 链表

[数据结构与算法] 学习记录合辑 (00) 导论

[数据结构与算法] 学习记录合辑 (08) 排序

[数据结构与算法] 学习记录合辑 (07) 图

[数据结构与算法] 学习记录合辑 (04) 递归

pandas数据处理实践三（DataFrame.apply、merge、rename，数据预处理、DataFrame.drop_duplicates去重）

pandas dataframe重复数据查看.判断.去重

python-dataframe数据预处理（二）之txt数据集文件合并

机器学习高质量数据集大合辑（附链接）

LeetCode刷题|数据结构归类|数组各算法题合辑（持续补充）

LeetCode刷题|数据结构归类|栈各算法题合辑（持续补充）

EEGLAB合辑 | 第八节使用 ICA 分解数据

EEGLAB合辑 | 第六节数据周期的选择与比较

EEGLAB合辑 | 第四节提取数据周期

EEGLAB合辑 | 第二节导入教程数据集的通道位置

EEGLAB合辑 | 第一节往EEGLAB导入数据

[数据结构与算法] 学习记录合辑 (03) 栈与队列

[数据结构与算法] 学习记录合辑 (01) 数组和字符串

[数据结构与算法] 学习记录合辑 (09, 完结) 哈希表

[数据结构与算法] 学习记录合辑 (05) 二叉树

pandas中DataFrame的数据去重

pythpython-dataframe数据预处理（一）之txt数据集文件分割

PYTHON数据预处理_DATAFRAME数据筛选LOC，ILOC，IX，AT，IAT

【Python】DataFrame 查看数据

11月26日云栖精选夜读 | 机器学习高质量数据集大合辑（附链接）

dataframe格式的数据处理

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)