数据分析入门之numpy数组数据大小比较与筛选去重 - 代码天地

数据分析入门之numpy数组数据大小比较与筛选去重

其他 2020-01-26 10:39:45 阅读次数: 0

文章目录

1.构造数组
2.比较数组的最值

2.1、比较所有列的最小值
2.2、比较所有行的最大值

3.比较数据
4.筛选出满足条件的数据
5.去掉重复数据

5.1、导入数据
5.2、数据去重

1.构造数组

import numpy
from pandas import DataFrame
df = DataFrame({
    'data1':numpy.random.randn(5),
    'data2':numpy.random.randn(5)
})
print (df)

#运行结果
      data1     data2
0  2.080182  0.494148
1 -0.291509 -0.260024
2 -0.066761  0.793961
3  0.826279  1.269465
4  1.215479 -1.329569

2.比较数组的最值

2.1、比较所有列的最小值

当求df中的列最小值时,默认axis=0，可以忽略不写

df.apply(lambda x:min(x))#方法一

df.apply(lambda x:min(x),axis=0)#方法二

#运行结果

data1   -0.291509
data2   -1.329569
dtype: float64

2.2、比较所有行的最大值

当axis=1时，表示为所有行的数据

df.apply(lambda x:max(x),axis=1)

#运行结果

0    2.080182
1   -0.260024
2    0.793961
3    1.269465
4    1.215479
dtype: float64

3.比较数据

比较同一行数据中是否全部满足条件，全部满足条件时，返回True，否则返回False

df.apply(lambda x:numpy.all(x>0),axis=1)

#运行结果

0     True
1    False
2    False
3     True
4    False
dtype: bool

4.筛选出满足条件的数据

df[df.apply(lambda x:numpy.all(x>0),axis=1)]

#运行结果

	data1	data2
0	2.080182	0.494148
3	0.826279	1.269465

5.去掉重复数据

5.1、导入数据

from pandas import read_csv
filename = "F:\\数据分析\\数据分析3\\章节4数据处理\\4\\4.3\\data.csv"
df = read_csv(filename,encoding="UTF-8")
print (df)

5.2、数据去重

df.drop_duplicates()

结果对比：
在这里插入图片描述

发布了62 篇原创文章 · 获赞 25 · 访问量 9309

私信关注

猜你喜欢

转载自blog.csdn.net/ayouleyang/article/details/103757741

数据分析入门之numpy数组数据大小比较与筛选去重

数据分析入门之Numpy数组对象学习

Python数据分析之Numpy入门

数据分析之NumPy基础入门

数据分析之numpy

pandas 筛选去除重复的数据

数据分析之Numpy-数组计算

数据分析之NumPy（五）数组间运算

数据分析(三)之numpy数组学习

python数据分析之NumPy入门2

数据分析入门之Numpy 矩阵与通用函数

【数据分析 - 基础入门之NumPy①】Anaconda安装及使用

数据分析手册-numpy数组(5)--比较通用函数与操作布尔数组

Python数据分析：numpy创建数组

Python数据分析：numpy数组属性

数据分析（1） Numpy数组

python数据分析-numpy数组操作

数据分析与展示---Numpy入门

Python 数据分析Numpy入门

数据分析(一)--numpy入门

数据分析----numpy快速入门

【数据分析入门】Numpy进阶

Python 数据分析三剑客之 NumPy（一）：理解 NumPy，数组基础

数据分析 numpy

数据分析-numpy

数据分析(numpy)

数据分析（numpy）

数据分析:Numpy

学习数据分析之python的numpy

初识数据分析之numpy

今日推荐

周排行

二叉搜索树与双向链表——一个对于我来说比较难的题目。二叉树的中序遍历

(JavaSE)Java集合专题一(List)

reset master和reset slave解析

android could not resolve

Shell 变量自增实现方法

上周热点回顾（10.7-10.13)

PAT（BL）1032挖掘机技术哪家强

站点防火墙api,增加黑名单IP接口,增加用post,修改用put,php案例

Caffe官方学习手册中文翻译版&Caffe各层参数配置详细解析&Caffe安装

蛋白质结构预测准确率&发展情况

每日归档

更多

2024-10-23(0)

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)