python 爬取万方数据

万方数据是最早的数据平台,针对非计算机专业的用户群体来说,需要经常下载数据。

因此今天你用scrapy框架实现一个万方数据下载的爬虫。只需要简单部署即可使用,下载的数据采用万方统一的规定格式存储。

下面展示爬虫主代码:


items.py文件字段定义:


在代码中我尽可能详细的备注了才用xpath获取元素的方式和html结构中可能出现的坑。

若你在学习爬虫,可以参考代码仔细学习下。


猜你喜欢

转载自blog.csdn.net/qq_32778043/article/details/80594268