# encoding:utf-8 import re # 使用正则 匹配想要的图片 import requests #使用requests得到网页源码 num = 1 # 定义mzt函数 def mzt(): # 这个是用来编辑图片的名字 (因为不喜欢看他原来图片的名字感觉乱乱的) for i in range(1, 3): # 循环100次 (可以用三元运算) # 得到图片的链接 并设置编码格式 yuan = requests.get('http://www.mzitu.com/zipai/comment-page-' + str(i)+'/#comments').content.decode('utf-8') demo = re.compile('<img src="(.*?)" .*?>', re.S) # 找到图片正则 list1 = demo.findall(yuan) # 去源码中找匹配到的这个链接 write_os(list1) def write_os(list1): global num for j in list1: # 遍历你得到的图片 num += 1 # 循环一次加一 yuan = requests.get(j).content # 得到你图片的内容 # 写进本地 with open('E:\\testtupian\\' + str(num) + '.jpg', 'wb') as f: f.write(yuan) # 写进去 f.close() # 关闭文件 if __name__ == '__main__': # 代码测试片段 mzt() # 调用你的函数
python使用正则爬取图片
猜你喜欢
转载自blog.csdn.net/qq_38900441/article/details/79951178
今日推荐
周排行