爬虫入门 - 代码天地

爬虫入门

移动开发 2018-05-10 02:11:14 阅读次数: 1

import urllib
import urllib2

dic = {}
dic['name'] = 'Dick'
dic['age'] = 20

data = urllib.urlencode(dic)#编码，post的数据
request = urllib2.Request('http://baidu.com',data)#创建请求对象
responce = urllib2.urlopen(request)#打开网页，返回'响应'对象
the_page = responce.read()
print the_page

#有一些站点不喜欢被程序（非人为访问）访问
#这时候可以把自身模拟成Internet Explorer

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'

headers = { 'User-Agent' : user_agent }    
req = urllib2.Request(url, data, headers)

猜你喜欢

转载自8850702.iteye.com/blog/2279305

Python爬虫：编写简单爬虫之新手入门

Python爬虫（一）：编写简单爬虫之新手入门

Python爬虫新手入门教学（九）：多线程爬虫案例讲解

新手入门的Scrapy爬虫操作--超详细案例带你入门

新手入门了

python爬虫之爬取壁纸（新手入门级）

Python爬虫新手入门教学（十九）：爬取ip代理，构建代理池

Python爬虫新手入门教学（十七）：爬取yy全站小视频

Python爬虫新手入门教学（十六）：爬取好看视频小视频

Python爬虫新手入门教学（十五）：爬取网站音乐素材

Python爬虫新手入门教学（十一）：最近王者荣耀皮肤爬取

Python爬虫新手入门教学（八）：爬取论坛文章保存成PDF

Python爬虫新手入门教学（七）：爬取腾讯视频弹幕

Python爬虫新手入门教学（六）：制作词云图

Python爬虫新手入门教学（五）：爬取B站视频弹幕

Python爬虫新手入门教学（四）：爬取前程无忧招聘信息

Python爬虫新手入门教学（二）：爬取小说

Python爬虫新手入门教学（一）：爬取豆瓣电影排行信息

Python爬虫新手入门教学（十三）：爬取高质量超清壁纸

Python爬虫新手入门教学（十二）：英雄联盟最新皮肤爬取

2021-11-03 Python爬虫新手入门第一步

GitBook新手入门

jeecg 新手入门

java新手入门

Jeecg新手入门

gcc新手入门

PostgreSQL新手入门

servlet的新手入门

nodejs新手入门

markdown新手入门

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)