. 可以匹配任何字符
* 可以匹配0个或无限多个之前的字符
.? 表示匹配任意字符到下一个符合条件的字符
# 创建正则表达式规则对象,匹配每页里的段子内容,re.S 表示匹配全部字符串内容
pattern = re.compile('<div\sclass="f18 mb20">(.*?)</div>', re.S)
# 将正则匹配对象应用到html源码字符串里,返回这个页面里的所有段子的列表
content_list = pattern.findall(html.decode('gbk'))