统计文本去重行数

其他 2021-03-21 17:08:15 阅读次数: 0

项目github地址：bitcarmanlee easy-algorithm-interview-and-practice
欢迎大家star，留言，一起学习进步

常见的一个需求为：统计某个文本去重以后的行数

可以使用如下命令：

sort xxxfile | uniq | wc -l

也可以使用如下命令

sort -u xxxfile | wc -l

简单解释一下

其中sort -u的选项，解释如下

     -u, --unique
             Unique keys.  Suppress all lines that have a key that is equal to an already processed one.  This option, similarly to -s, implies a stable sort.  If used with -c or -C,
             sort also checks that there are no lines with duplicate keys.

可见sort的-u选项，就是自带去重功能。

而uniq 不会检查重复的行，除非它们是相邻的行，所以统计去重行数的时候，得先用sort排序，排序完了再用uniq去重，最后达到去重的目的。

猜你喜欢

转载自blog.csdn.net/bitcarmanlee/article/details/112124066

统计文本去重行数

linux 下统计文本行数

Python多种方式统计文本行数大文本文件行数文件内

使用shell统计多行文本中非重复行数

linux下统计文本行数的各种方法

java 统计大文本文件的行数

统计一个文件夹下的多个文本文件的行数、空行数和注释行数

linux下统计文本行数的各种方法之使用shell脚本统计

linux下统计文本行数的各种方法之命令行统计

统计一个目录下所有文件的文本行数

统计出文本的总行数，并找出出现次数最多的那个整数

wc 统计文件的行数

mysql 行数统计及体积

统计代码行数

linux 统计字数行数

linux 统计文件的行数

统计xcode代码行数

Android Studio 统计行数

Eclipse统计代码行数

JAVA统计代码行数

代码行数统计

Unity 统计代码行数

Linux统计代码行数

统计文件行数

iOS - 统计代码行数

Linux统计文件行数

python 统计文件行数

统计VS代码行数

IDEA 统计代码行数

统计项目代码行数

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)