pandas入门(十二)

上一篇:pandas入门(十一)

检测和过滤异常值

过滤或变换异常值(outlier)在很大程度上就是运用数组运算。来看一个含有正态 分布数据的DataFrame

在这里插入图片描述

=====================================
找出某列中绝对值大小超过3的值
在这里插入图片描述

=====================================
选出全部含有“超过3或-3的值”的行,你可以在布尔型DataFrame中使用any方法
在这里插入图片描述

=====================================
就可以对值进行设置。可以将值限制在区间-3到3以内
在这里插入图片描述

=====================================
根据数据的值是正还是负,np.sign(data)可以生成1和-1
在这里插入图片描述

排列和随机采样

利用numpy.random.permutation函数可以轻松实现对Series或DataFrame的列的排 列工作(permuting,随机重排序)。通过需要排列的轴的长度调用permutation, 可产生一个表示新顺序的整数数组
在这里插入图片描述

=====================================
基于iloc的索引操作或take函数中使用该数组了
在这里插入图片描述

=====================================
不用替换的方式选取随机子集,可以在Series和DataFrame上使用sample方法
在这里插入图片描述

=====================================
要通过替换的方式产生样本(允许重复选择),可以传递replace=True到sample
在这里插入图片描述

扫描二维码关注公众号,回复: 9210282 查看本文章

++++++++++++++++++++++++++++++++++++

下一篇:pandas入门(十三)

发布了75 篇原创文章 · 获赞 117 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_42893334/article/details/103742921
今日推荐