awk中分隔符中的一个小妙用

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Jerry_1126/article/details/84111784

处理文本的时候如果碰到,诸如"123abc,45^&dfgh67ab|&8"这种以所有非数字的来隔开数字的字符串,要得出数字字符串的个数。

其中连续的数字,比如123算一个。这个时候可以借助awk中的-F分隔符来处理,可以起到妙用的效果!

[root@host ~]# echo "123abc,45^&dfgh67ab|&8" | awk -F"[^0-9]" '{print NF}'
4

上面的一条语句就可以将其分隔开,并统计出个数为。[^0-9]为所有非数字的分隔符。 NF为分隔后的列数!

如果使用Python来处理,就可以这里操作:

>>> import re
>>> S = "123abc,45^&dfgh67ab|&8"
>>> L = re.findall(r"\d+", s)
>>> L
['123', '45', '67', '8']
>>> len(L)
4
>>>

或者

>>> import re
>>> S = "123abc,45^&dfgh67ab|&8"
>>> L = re.split(r"[^0-9]+", S)
>>> L
['123', '45', '67', '8']
>>> len(L)
4
>>>

猜你喜欢

转载自blog.csdn.net/Jerry_1126/article/details/84111784