1、re.search
re.search 扫描整个字符串并返回第一个成功的匹配,匹配成功re.search方法返回一个匹配的对象,否则返回None。
函数语法
re.search(pattern, string, flags=0)
- 参数说明:
pattern:匹配的正则表达式
string:要匹配的字符串。
flags:标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
2、re.match
re.match 尝试从字符串的起始位置匹配一个模式,若匹配成功 re.match 方法返回一个匹配的对象,否则返回 None(如果不是起始位置匹配成功的话,match() 也会返回 None。)
函数语法
re.match(pattern, string, flags=0)
- 参数说明:
pattern:匹配的正则表达式
string:要匹配的字符串。
flags:标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
3、re.findall
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果有多个匹配模式,则返回元组列表,如果没有找到匹配的,则返回空列表。
语法格式
findall(string[, pos[, endpos]])
- 参数说明:
string : 待匹配的字符串。
pos : 可选参数,指定字符串的起始位置,默认为 0。
endpos : 可选参数,指定字符串的结束位置,默认为字符串的长度。
4、区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配;而re.findall()方法匹配目标字符串中所有满足条件的正则表达式
- 具体看Python正则表达式
5、正则表达式group分组
group()用来提出分组截获的字符串,在正则表达式中’()'用来分组
import re
a = "123abc456"
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0)) #123abc456,返回整体
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1)) #123
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2)) #abc
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3)) #456