python2网页采集案例 - 代码天地

python2网页采集案例

其他 2018-05-30 05:17:23 阅读次数: 1

1.简单直接采集

import urllib2
response=urllib2.urlopen('http://www.xxx.com')
#获取状态吗,如果是200表示获取成功
print response.getcode()
#读取内容
cont=response.read()
print len(cont)

2.带参数采集
import urllib2
#创建Request对象
request=urllib2.Request('http://www.xxx.com')
#添加数据
request.add_data('a','1')
#添加http的header
request.add_header('User-Agent','Mozilla/5.0')
#发送请求获取结果
response=urllib2.urlopen(request)
print response.getcode()

3.带cookie采集
import urllib2,cookielib
#创建cookie容器
cj=cookielib.CookieJar()
#创建1个opener
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
#给urllib2安装opener
urllib2.install_opener(opener)
#使用带有cookie的urllib2访问网页
response=urllib2.urlopen('http://www.xxx.com')
print cj
print response.getcode()

print response.read()

特殊采集：
有的采集需要cookie的支持
有的采集需要proxy代理
有的采集需要https加密方式
有的采集是需要做Redirect跳转

猜你喜欢

转载自blog.csdn.net/abiao555/article/details/80437509

python2网页采集案例

python网络爬虫入门（四、采集单一网页特定数据）

Python2获取网页标题

python2之字符编码案例分析（2）

Java 解决采集UTF-8网页空格变成问号乱码

HTML5网页设计小案例：网页导航栏的设计

python2之字符编码案例分析

python2之字符编码案例分析（1）

python3网页抓取与下载文件

404网页源码

使用cpolar发布树莓派网页（apache2网页的发布）

python2

Python2的安装

python2 编码

Python2学习

python2教程

学习python2

【python2】【error】

python2 assert

python2利用urllib2抓取中文网页乱码的问题

Python2 urllib2爬取网页一简单爬取

HTML5网页设计小案例：逸仙园茶馆招聘启事网页的设计

HTML5网页设计小案例：帝豪集团总裁办通知网页设计

用python2和python3伪装浏览器爬取网页

4-1 /2网页生命周期 PageLoad事件

CSS3网页定位技术（2）——相对定位

html2canvas 把h5网页保存为图片区域保存

学校官网首页 2页网页设计(HTML+CSS+JavaScript)

Python爬虫案例：采集青创网批发商品数据（附代码）

02网页前端HTML——列表

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)