目录
1.写在前面
我们在学习过程中避免不了和文本打交道,文本分析也是我们学习的重要一个知识点。这篇博客我们带着学习文本分析常用到的命令,方便我们以后的学习研究。我们将重点介绍 cut 、sort、 wc 、sed 、awk 这5个命令。
2. cut 显示切割的行数据
我们还是拿上次的grep.txt文件做实验,我们先看一下这个文件,这个文件中有几行是有空格隔开的。
把这个文件按照我们指定的分隔符进行分割,并且显示第一列。
把文件按照分割符分割,并且显示第一列和第二列。(展示第三列同)
把文件按照分隔符分割,并且显示1到3列。
把文件按照分割符分割,并且显示1到3列,不展示没有分隔符的行。
3.sort 排序文件的行
我们在排序的时候,一般要选定一个排序的原则。
我们创建一个sort.txt,用来演示sort的功能。
直接使用sort排序,默认使用字典序排序。
按照第二列-价格进行排序(逆序)
3.wc 命令 统计单词(行数、单词数、字节数)
4.sed 行编辑器(修改某一行的数据)
5.awk 一个强大的文本分析工具
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说,awk就是把文件逐行的读入,(空格,制表符)为默认的分隔符,将每行切片,切开的部分再进行各种分析处理。
5.1 报表实战
我们新建一个awk.txt文件,如下: