爬取贴吧网页保存到本地文件夹中 - 代码天地

爬取贴吧网页保存到本地文件夹中

其他 2021-04-01 21:03:41 阅读次数: 0

爬取贴吧网页保存到本地

#!usr/bin/env python
# -*- coding:utf-8 _*-
"""
@author: Administrator
@file: tieba_test.py
@time: 2020/09/15
@desc:
"""
import requests
import os

class tiebaSpider():
    def __init__(self, tieba_name):
        self.tieba_name = tieba_name
        self.headers = {
    
    
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36'
        }
        self.base_url = "https://tieba.baidu.com/f?kw=" + tieba_name + "&ie=utf-8&pn={}"

    def get_url_list(self):
        url_list = []
        for i in range(10):
            url_list.append(self.base_url.format(i * 50))
        return url_list

    def parse_url(self, url):
        print(url)
        response = requests.get(url, headers=self.headers)
        return response.content.decode()

    def save_url(self, url_html, page_num):
        name = '贴吧目录'
        if name not in os.listdir('./'):
            os.mkdir(name)
        path = './贴吧目录/{}贴吧-第{}页'.format(self.tieba_name, page_num)
        with open(path, 'w', encoding='utf8') as f:
            f.write(url_html)

    def run(self):
        url_list = self.get_url_list()
        for url in url_list:
            url_html = self.parse_url(url)
        	# url在url_list的索引+1就是页面的页数
            page_nam = url_list.index(url) + 1
            self.save_url(url_html, page_nam)


if __name__ == '__main__':
    tiebaSpider('lol').run()

猜你喜欢

转载自blog.csdn.net/weixin_44429965/article/details/108609852

爬取贴吧网页保存到本地文件夹中

贴吧爬取保存到本地

爬取多态加载图片同时保存到本地指定文件夹

爬取一个网页保存到本地文件

Java 爬取网页并保存到本地

爬取网站图片，并下载保存到指定文件夹

爬取校花图片保存到本地文件夹下（requests+re）

python数据可视化开发(4)：爬取对应地址的pdf文档并分类保存到本地文件夹（爬虫）

Paython爬取网页所有图片并保存到本地

python爬取网页图片并保存到本地

nodejs爬取网页所有有效图片资源，并下载到本地文件夹中

爬取优美图库里的照片，并存到文件夹中

Python爬虫【实战篇】百度贴吧爬取页面存到本地

使用jsoup爬取网页信息，保存到txt中

python爬虫爬取图片保存到本地文件

爬取图片并保存到本地

XPath：爬取百度贴吧图片，并保存本地

python：爬取贴吧的某个吧的网页信息

python爬取图片到本地文件夹

爬取贴吧

贴吧爬取

node.js 爬虫实现爬取网页图片并保存到本地

Scrapy爬取并保存到TXT文件

Android实现截屏，将截图文件保存到本地文件夹

APP接口传的base64图片保存到服务器中。（1、保存到服务器本地，2、保存到服务器的共享文件夹中）

001 爬取百度贴吧并保存

java前端上传图片保存到本地文件夹

canvas生成图片并保存到本地文件夹主要代码

Android开发网络图片保存到本地指定文件夹

小程序视频源码开发网络图片保存到本地文件夹

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)