百度搜的简单爬虫:伯乐在线文章爬取(标题,类型,点赞数,日期)
断点调试,爬取连接http://blog.jobbole.com/114666/文章
改进,用css选择器代替xpath方法
在进行断点调试
结果一样。
总结:css选择器相对于xpath方法较简单,两者各有优点
扫描二维码关注公众号,回复:
5416516 查看本文章
百度搜的简单爬虫:伯乐在线文章爬取(标题,类型,点赞数,日期)
断点调试,爬取连接http://blog.jobbole.com/114666/文章
改进,用css选择器代替xpath方法
在进行断点调试
结果一样。
总结:css选择器相对于xpath方法较简单,两者各有优点