基础爬虫-----正则表达式(贪婪模式与懒惰模式以及函数)

1.两种模式的介绍:

# 贪婪模式与懒惰模式:贪婪模式核心就尽可能多的匹配,相反懒惰
# 模式的核心是尽可能少的匹配

1.1案例代码:

string = "pythony"
# 贪婪模式----找到第一个y还不够直到未找到为止(比较模糊)
data = "P.*y"
# 懒惰模式(精准)
data1 ="p.*?y"
result = re.search(data,string,re.I)
result1 = re.search(data1,string,re.I)
print(result)
print(result1)
1.1案例运行结果

2.正则表达式函数:

2.1.match函数:案例代码:

# 1.match函数-----只能从头开始匹配
string = "pythony"
data = "p.*y"
data1 = "t.*y"
result = re.match(data,string,re.I)
result1 = re.match(data1,string,re.I)
print(result)
print(result1)
2.1案例运行结果:

2.2 search函数不介绍(看之前的案例) 

2.3 全局匹配函数:案例代码:

# 3.全局匹配函数
string = "poythonhhdjhsptypbyysy"
data = "p.*y"
data1 = "p.*?y"
result = re.search(data,string,re.I)
# 全局匹配格式re.compile(正则表达式).findall(数据)
result1 = re.compile(data1).findall(string)
print(result)
print(result1)
2.3案例运行结果
发布了98 篇原创文章 · 获赞 34 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/weixin_42133768/article/details/96557752