最近开始学习python爬虫的东西,看了网上的 教程,python2和python3的版本都有,找着示例的代码敲有时候就会报错,可以看到python3相比于python2还是在语法改变了一些,下面是一个简单示例的修改
import urllib page = urllib.urlopen('http://www.baidu.com')#打开网页 htmlcode = page.read() print htmlcode#在控制台输出
一个爬取百度首页html的代码,我的电脑安装的是python3+,运行后会出现报错信息
查了一下,官方3.0版本已经把urllib2,urlparse等五个模块都并入了urllib中,也就是说urlopen并没有直接保存在urllib中,大概是这样??需要调用保存在urllib下的request,urlopen保存在这里,修改后代码如下:
import urllib.request htmlcode=urllib.request.urlopen("http://www.baidu.com").read() print(htmlcode)
运行成功,就是为什么都不换行的啊喂ヽ(●-`Д´-)ノ
可能还是有哪里不对,欢迎指出