利用正则表达式和Request库爬取知乎发现页面的标题部分 - 代码天地

利用正则表达式和Request库爬取知乎发现页面的标题部分

其他 2019-03-14 09:21:02 阅读次数: 0

import requests
import re 

headers = {
    'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
}
r = requests.get("https://www.zhihu.com/explore", headers = headers)
pattern = re.compile('explore-feed.*?question_link.*?>(.*?)</a>',re.S)
titles = re.findall(pattern, r.text)
print(titles)

运行结果：

['\n目前求 π 的算法中哪种收敛最快？\n', '\n为什么我感觉张鹤帆很奇怪？\n', '\n怎么样客观看待张云雷现象？\n', '\n为什么中国摔跤和柔道如此相似？\n', '\n网络小说里有什么沙雕情节？\n', '\n电影《流浪地球》有哪些细节和彩蛋？\n', '\n王鸥是怎么度过她的人生低谷的（就是众所周知的夜光剧本事件之后那段时间）？\n', '\n你见过哪些蠢到家的罪犯？\n', '\n八月长安笔下的梗哪个最戳你？\n', '\n怎么评价欧阳娜娜的穿搭？\n']

参考：《Python3网络爬虫开发实战》

猜你喜欢

转载自blog.csdn.net/qq_39362996/article/details/87874126

利用正则表达式和Request库爬取知乎发现页面的标题部分

利用requests库和正则表达式爬取猫眼电影

利用Requests库和正则表达式爬取豆瓣影评Top250

re 正则表达式爬取网站标题

Python正则表达式制作简单爬虫,爬取知乎主题/关注度/url

Selenium+python --使用正则表达式爬取页面的URL链接

利用正则表达式爬取HTML页面内容

Python 利用BeautifulSoup和正则表达式来爬取旅游网数据

利用requests和正则表达式爬取猫眼Top250电影

多进程，Request+正则表达式爬取榜单类网站

request+正则表达式，爬取豆瓣电影top100

python3.6 利用requests和正则表达式爬取猫眼电影TOP100

利用requests和正则表达式re爬取猫眼电影top100，并下载图片

利用Matlab正则表达式爬取网页数据

Python爬虫-利用正则表达式爬取猫眼电影

python-对豆瓣的top250的爬取(利用正则表达式)

爬取猫眼电影榜单Top100—利用requests、正则表达式

利用正则表达式爬取猫眼电影TOP100信息

爬虫实战——利用正则表达式爬取古诗文网

利用正则表达式爬取官网数据及反反爬虫方法分析

python 正则表达式爬取新闻详情页面

Python +正则表达式爬取豆瓣页面邮箱

python爬虫入门——爬取猫眼电影排行（使用requests库和正则表达式）

Requests + 正则表达式爬取猫眼电影

正则表达式爬取猫眼电影

requests正则表达式爬取猫眼电影

python正则表达式爬取猫眼电影

正则表达式爬取猫眼电影100

python爬取准备二正则表达式

正则表达式爬取网页实战

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)