Python糗百爬虫 - 代码天地

Python糗百爬虫

编程语言 2018-05-18 22:48:39 阅读次数: 5

# -*- coding:utf-8 -*-
import urllib2
import urllib
import re
url='https://www.qiushibaike.com/8hr/page/1/'

headers={
'User-Agent' : 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
}
try:
    request=urllib2.Request(url,headers=headers)
    response=urllib2.urlopen(request)
    content=response.read().decode('utf-8')
    pattern=re.compile('<div class="author.*?<h2>(.*?)</h2>.*?'+'<div class="content">.*?<span>(.*?)</span>.*?'+'<i class="number.*?>(.*?)</i>(.*?)</span>.*?',re.S)
    items=re.findall(pattern,content)
    for item in items:
        print item[0],item[1],item[2],item[3]
except urllib2.URLError,e:
    if hasattr(e,"code"):
        print e.code
    if hasattr(e,"reason"):
        print e.reason

爬取结果：

猜你喜欢

转载自blog.csdn.net/qq_40265501/article/details/80345661

Python糗百爬虫

python自制的糗百爬虫

python 爬虫糗百成人

Python爬虫糗百段子

糗百爬虫

Python 爬虫入门(一)——爬取糗百

Python爬虫最入门的教程案例：爬取糗百

多线程糗百爬虫

爬虫学习之-糗百

爬虫入门（1）--糗百

Python爬虫项目：爬虫爬取正则分析糗百数据

糗百爬虫多线程实现

Python3抓取糗百、不得姐

python爬虫scrapy框架爬取糗妹妹段子首页

爬虫实例之使用requests和Beautifusoup爬取糗百热门用户信息

python最简洁！最简单！爬取糗百笑话内容！（有详细说明）

（68）-- 爬取糗百信息

Python 爬虫得用正则进行数据解析爬取糗图图片并保存一本地

Java爬取糗百段子

python爬虫百度翻译

python 糗事百科爬虫

python爬虫-百度/360搜索

python 百度图片爬虫

python爬虫(百度图片)

python爬虫(百度音乐)

[python]百度贴吧爬虫

python爬虫-糗事百科段子

python糗事百科爬虫

python-爬虫-糗事百科

python 爬虫百度地图的界面

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)