正则匹配里面的(.*?)

. 可以匹配任何字符
* 可以匹配0个或无限多个之前的字符
.
? 表示匹配任意字符到下一个符合条件的字符

 # 创建正则表达式规则对象,匹配每页里的段子内容,re.S 表示匹配全部字符串内容
 pattern = re.compile('<div\sclass="f18 mb20">(.*?)</div>', re.S)
 # 将正则匹配对象应用到html源码字符串里,返回这个页面里的所有段子的列表
 content_list = pattern.findall(html.decode('gbk'))

猜你喜欢

转载自blog.csdn.net/Albert_Ejiestein/article/details/89518398