python正则表达式的预编译re.comile()方法

我们现在知道要使用正则表达式进行匹配查找等操作,需要有两个字符串,一个是模式字符串pat,一个是范围字符串s。有些时候,我们需要大量重复的进行匹配等操作,为了提高效率,我们可以使用python中正则表达式的预编译功能来达到一次编译,全局使用的效果,从而减少编译的次数,提高程序运行的效率。
编译的意思其实就是翻译,指把程序语言翻译成计算机的语言,这个过程是需要时间的,而正则表达式的使用第第一步,就是对表达式进行编译,我们如果在for循环里面执行这个操作,那么这个操作就要执行很多次,不如我们一开始就把这个动作做好了,直接把机器码拿过来用。这样就省去了多次编译造成的资源浪费。
实例代码如下:

import re
s = [0.2,1.5,-16,'good',-0.1,'11.43',10,'5e10']
rec = re.compile(r'^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$')
for i in s:
	if rec.match(str(i)):
		print(i)

这个正则表达式比较复杂,中间用了一个|隔开,表示先匹配左边的,左边的没有找到,再去匹配右边的表达式,我们在复习一下,\开头的表示某一类数据的字母代数式,[]表示某一类数据的几何,运行结果如下:

0.2
1.5
11.43
[Finished in 0.6s]

这样就完成了对整浮点数的提取任务,还是要理解match的语法:re.compile(pat).match(s),特别是其中模式字符串和目标字符串的位置。

发布了152 篇原创文章 · 获赞 6 · 访问量 4034

猜你喜欢

转载自blog.csdn.net/weixin_41855010/article/details/104434225
今日推荐