简单爬虫--爬取豆瓣阅读出版社信息并保存

其他 2020-02-18 15:16:46 阅读次数: 0

先看看要爬取页面出版社信息格式：
在这里插入图片描述

import urllib.request
import re

data = urllib.request.urlopen("https://read.douban.com/provider/all").read().decode("UTF-8")
# print(len(data))
pat = '<div class="name">(.*?)</div>'
r = re.compile(pat).findall(data)
# print(r[0])
fh = open("C:/Users/Nicht_sehen/Desktop/cbs.txt","w")
for i in range(0,len(r)):
    fh.write(r[i]+"\n")
fh.close()

打开桌面的cbs文件：
在这里插入图片描述
可以看到爬下来的出版社信息已经写入了文件

Nicht_Sehen

发布了125 篇原创文章 · 获赞 56 · 访问量 7万+

私信关注

猜你喜欢

转载自blog.csdn.net/Nicht_sehen/article/details/102017850

简单爬虫--爬取豆瓣阅读出版社信息并保存

python之简单爬虫（爬取豆瓣出版社）

简单利用Python爬取豆瓣网某网页的出版社信息

python爬取豆瓣出版社

Python爬虫案例1——豆瓣出版社爬取并写入文件

爬取豆瓣出版社列表并写入文件中

python网络爬虫——爬取人民邮电出版社新书推荐信息

python学习，爬去豆瓣出版社

Python数据挖掘学习笔记（5）爬取豆瓣阅读的出版社名称数据

简单爬虫爬取豆瓣电影信息

简单出版社系统页面展示

python爬虫，爬取豆瓣电影信息

python爬虫爬取豆瓣电影信息

爬虫爬取豆瓣高分电影信息

删除出版社：

新增出版社：

JS新手案例---出版社信息

一个简单的爬虫：爬取豆瓣的热门电影的信息

Python爬虫：scrapy爬取腾讯社招职位信息

<scrapy爬虫>爬取腾讯社招信息

Python爬虫框架Scrapy爬取腾讯社招信息

中国出版社排名

Python爬虫入门 | 2 爬取豆瓣电影信息

python爬虫爬取豆瓣书籍信息并生成表格

Python爬虫-爬取豆瓣信息(selenium+xpath)

爬虫实践--豆瓣电影当前上映电影信息爬取

python3爬虫 —— 爬取豆瓣电影信息

【python爬虫实例】爬取豆瓣图书及信息

Python爬虫入门 | 爬取豆瓣电影信息

python爬虫——爬取豆瓣top250电影信息

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)