爬取图片并按标题建立文件夹存图 - 代码天地

爬取图片并按标题建立文件夹存图

其他 2018-09-01 11:50:43 阅读次数: 0

import requests,re
import json
from urllib import request
import os

url = 'https://www.toutiao.com/search_content/?offset={}&format=json&keyword=%E8%A1%97%E6%8B%8D&autoload=true&count=20&cur_tab=1&from=search_tab'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36',

}
for i in range(1):

    url = 'https://www.toutiao.com/search_content/?offset={}&format=json&keyword=%E8%A1%97%E6%8B%8D&autoload=true&count=20&cur_tab=1&from=search_tab'.format(20*i)
    response= requests.get(url,headers=headers)

    res = response.json()
    data_list = res['data']

    # 新建文件夹
    # if not os.path.exists(title) :
    #     os.mkdir(title)
    for data_item in data_list:
        if 'article_url' in data_item:
            article_url = data_item['article_url']
            title=data_item['title']
           #新建一个总文件夹/一个标题在建立一个文件夹（分类）
            if not os.path.exists('download'+'/'+title):
                os.mkdir('download'+'/'+title)
            #print(title)
            # print(article_url)
            response = requests.get(article_url,headers=headers)

            res_html = response.text
            # print(res_html)
            res_zhengze = r'gallery: JSON\.parse\((.*)\),'
            pattern = re.search(res_zhengze, res_html)
            if pattern:
                res_2 = json.loads( pattern.group(1))
                res_3 = json.loads(res_2)
            else:
                continue#终止下面的执行代码，从下一个url开始执行
            for res_4 in res_3['sub_images']:
                res_5 = res_4['url']
                print(res_5)
                name = res_5.split('/')[-1] + '.jpg'
                filename ='download/'+title+'/'+ name

                # 下载图片
                request.urlretrieve(res_5, filename)

猜你喜欢

转载自blog.csdn.net/weixin_42958164/article/details/81750663

爬取图片并按标题建立文件夹存图

python爬取图片到本地文件夹

scrapy 图片爬取多层多页保存不同的文件夹重命名full文件夹

python 爬取指定图片并将图片下载到指定文件夹

xpath爬取妹子图 http://www.mzitu.com 并保存文件夹

（70）--爬取哦漫画图片并下载到相应文件夹

爬取网站图片，并下载保存到指定文件夹

爬取多态加载图片同时保存到本地指定文件夹

Python爬取皮克斯图片网站并放入文件夹——代码可直接运行

正则爬取海量美女图片(自动生成文件夹并储存)

正则爬取天堂图片网并存储在自动生成文件夹中

爬取百度大数据350张图片并存入本地文件夹

python恶搞脚本-自动创建文件夹爬取图片

小爬虫爬取小猫咪图片并存入本地文件夹

Python 爬虫之实现爬取图片并下载到自己创建的文件夹内

scrapy爬取新浪网站全栈新闻标题内容，并且分类存入文件夹中

建立文件夹

【python】爬取优信二手车首页的图片被下载到文件夹中

nodejs爬取网页所有有效图片资源，并下载到本地文件夹中

文件夹的建立和文件的建立

批量取出文件夹中图片的名字存进文本，并去命名新的文件夹下的图片

C++opencv中读取文件夹中的多幅图片并按顺序重命名后保存到另一文件夹中

Python如何将大量文件夹中图片批量复制到指定文件夹，并按照顺序重新命名

opencv按像素切割图片并按照类别编号并存储在指定文件夹（2）

Python:批量按xml标注将目标crop剪切图片并按类保存到相应文件夹

python-opencv文件夹中所有视频按顺序截图片并按顺序命名

教你用python爬取王者荣耀英雄皮肤图片，并将图片保存在各自英雄的文件夹中。（附源码）

妹子图图片爬取

糗图-图片爬取

图片写入文件夹

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)