Python爬取13个旅游城市,告诉你假期大家最爱去哪玩?

通过分析去哪儿网部分城市门票售卖情况,简单的分析一下哪些景点比较受欢迎。等下次假期可以做个参考。
Python系列教程,免费获取,遇到bug及时反馈,讨论交流可加扣裙<60 61 15 02 7>

用到的Python模块

BeautifulSoup、requests、pymongo、pylab

方法

通过请求https://piao.qunar.com/ticket/list.htm?keyword=北京 ,获取北京地区热门景区信息,再通过BeautifulSoup去分析提取出我们需要的信息。

这里为了偷懒只爬取了前4页的景点信息,每页有15个景点。因为去哪儿并没有什么反爬措施,所以直接请求就可以了。

这里只是随机选择了13个热门城市:北京, 上海, 成都, 三亚, 广州, 重庆, 深圳, 西安, 杭州, 厦门, 武汉, 大连, 苏州。

并将爬取的数据存到了MongoDB数据库 。

爬虫部分完整代码如下

扫描二维码关注公众号,回复: 12719986 查看本文章

效果图如下

有了数据,我们就可以分析出自己想要的东西了

 

最受欢迎的15个景区

 

由图可以看出,在选择的13个城市中,最热门的景区为上海的迪士尼乐园

代码如下

猜你喜欢

转载自blog.csdn.net/bobin666/article/details/107584303