如何从文本中截取自己想有得数据并去重，统计，排序 - 代码天地

如何从文本中截取自己想有得数据并去重，统计，排序

其他 2019-01-07 23:37:18 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/weixin_36586564/article/details/84935682

关键的指令为：
awk为分割截取，sort为排序，uniq为去重，wc为统计，你需要单独去理解这些指令，然后通过管道进行数据传送

特别注意：
用uniq命令可以删除相邻的重复行：
uniq [file]
但如果一文本中有重复却不相邻的行则无法删除，需要结合sort命令：
sort [file]|uniq
等效的sort命令是：
sort -u [file]
去重复后统计：

sort needsort.txt |uniq |wc

语句为：
语句一：
先排序再去重

grep -rn '"字符串"' query_data.csv |awk -F" " '{ print $4 }'|awk -F "|" '{ print $4 }' | sort|uniq -c|sort

语句二：
去重并统计

grep -rn '"evo"' query_data.csv |awk -F "|" '{ print $4 }' | sort|uniq -c|sort -r|wc -l

语句三：
将文件夹下的所有文件写入同一个文件中：

for i in `ls`;do cat $i >>17-18.csv;done

语句四：
查找某文件夹下所有类型的文件重写至一个文件中

for i in `find /work/logger/prod/2018-12-09 -type f -name "*.blob"`;do cat $i >>20181208.log;done

猜你喜欢

转载自blog.csdn.net/weixin_36586564/article/details/84935682

如何从文本中截取自己想有得数据并去重，统计，排序

Shell中cut字符截取、sort文本排序、uniq文本去重

机器想有自己的思想

linux如何排序去重

Linux命令去重统计排序（awk命令去重，sort, uniq命令去重统计）

Linux命令去重统计排序

统计次数（排序去重）

python文本去重并排序

hive 在统计汇总时候，如何去重

php中对二维数组的去重，合并，排序，分页操作，统计数组中所有值出现的次数。

List去重并统计重复的数据

Mysql count统计去重的数据

sql 排序有序去重

vim：如何排序和去重

JavaScript中的数据的去重

SAX解析没有得到数据。。。。。。。。。

Execl可以排序/统计重复列/去重

2354. 优质数对的数目-排序去重，加统计

如何在excel中抓取自己需要的数字

SQL去重统计

hive去重统计

长文本去重

python 文本去重

Python文本去重

文本去重

shell文本去重

大数据排序，取重或去重相关问题案例

☕【难点攻克技术系列】「海量数据计算系列」如何使用BitMap在海量数据中对相应的进行去重、查找和排序

如何从备份文件中获得数据名字

hadoop改写WordCount统计所有单词个数（去重）

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)