正则表达式有两种基本的操作,分别是匹配和替换。
匹配就是在一个文本字符串中搜索匹配一特殊表达式;
替换就是在一个字符串中查找并替换匹配一特殊表达式的字符串。
1.基本元素
正则表达式定义了一系列的特殊字符元素以执行匹配动作。
正则表达式基本字符
想要学习Python?Python学习交流群:452739833满足你的需求,资料都已经上传群文件流,可以自行下载!
在正则表达式中,我们还可用匹配限定符来约束匹配的次数。
匹配限定符
据上所述,".*"为最大匹配,能匹配源字符串所有能匹配的字符串。".* "为最小匹配,只匹配第一次出现的字符串。如:d.*g能匹配任意以d开头,以g结尾的字符串,如"debug"和"debugging",甚至"dog is walking"。而d.* g只能匹配"debug",在"dog is walking"字符串中,则只匹配到"dog "。
在一些更复杂的匹配中,我们可用到组和运算符。
组和运算符
有一组特殊的字符序列,用来匹配具体的字符类型或字符环境。如\b匹配字符边界,food\b匹配"food"、"zoofood",而和"foodies"不匹配。
特殊字符序列
有一套声明(assertion)对具体事件进行声明。
正则表达式声明
正则表达式还支持一些处理标志,它会影响正则式的执行方法。
处理标志
2.操作
通过re模块,我们就可在python中利用正则式对字符串进行搜索、抽取和替换操作。如:re.search()函数能执行一个基本的搜索操作,它能返回一个MatchObject对象。re.findall()函数能返回匹配列表。
代码如下:
MatchObject对象方法
使用sub()或subn()函数可在字符串上执行替换操作。sub()函数的基本格式如下:
sub(pattern,replace,string[,count])
示例代码如下
replace参数可接受函数。要获得替换的次数,可使用subn()函数。subn()函数返回一个元组,此元组包含替换了的文本和替换的次数。
如果需用同一个正则式进行多次匹配操作,我们可把正则式编译成内部语言,提高处理速度。编译正则式用compile()函数来实现。compile()函数的基本格式如下:
compile(str[,flags])
str表示需编译的正则式串,flags是修饰标志符。正则式被编译后生成一个对象,该对象有多种方法和属性。
正则式对象方法/属性
转义字符串用re.escape()函数。
通过getattr获取对象引用
代码如下:
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对小编的支持。