（笔记）简单爬虫爬取公交线路

其他 2018-06-05 10:12:32 阅读次数: 0

（笔记）简单爬虫爬取公交线路

学校数学建模选拔B题，发愁没有公交线路数据，于是百度了下，居然发现沈阳市公交站点这么多，所以学习了python爬虫，把它爬了下来哈哈哈。做一个笔记
爬取的URL是”http://shenyang.8684.cn/line1“,沈阳市内公交的站点。没有复杂的逻辑，网站也没有反爬，所以采用request和etree。

import  requests
from lxml import etree

lineInfo = list()
url = "http://shenyang.8684.cn/line1"

html = requests.get(url).text
Selector = etree.HTML(html)
nodes = Selector.xpath('//*[@id="con_site_1"]/a')

with open("target.txt","w") as f:
    for n in nodes:
        print(n.xpath('text()')[0])
        # print(n.xpath('@href')[0])
        urlNext = "http://shenyang.8684.cn/{0}".format(n.xpath('@href')[0])
        htmlNext = requests.get(urlNext).text
        SelectorNext = etree.HTML(htmlNext)
        stations = SelectorNext.xpath('//*[@id="bus_line"]/div[5]/div/div/a/text()')
        print(stations)
        lineInfo.append([n.xpath('text()')[0],stations])
    for i in lineInfo:
        str = '{0}'.format(i[0])
        for j in i[1]:
            str = str+" -->"+j;
        f.write(str+'\n\n');
        print(str)
f.close()

哈哈，就先这样，以后用到再学。

几个小时后的更新
发现爬下来对数学建模也没有什么帮助，好气。

猜你喜欢

转载自blog.csdn.net/ishandsomedog/article/details/80552655

（笔记）简单爬虫爬取公交线路

Python爬虫 - 爬取公交线路

python_爬虫爬取高德地图公交线路_赠高德地图key

公交线路管理

<爬虫实例> 8684公交网-太原公交线路信息

”城市公交线路站点数据爬取 + csv站点数据转ShapeFile矢量数据“（二）配置html页面以及抓包json数据

”城市公交线路站点数据爬取 + csv站点数据转ShapeFile矢量数据“（三）点csv转shp

[Hnoi2010]Bus 公交线路

[HNOI2010]公交线路

[LeetCode] Bus Routes 公交线路

杭州网易公交线路总结

公交线路思维，分支（女赛）

公交线路提示(课设）

一个以前的项目--公交线路查询系统

jsp1521公交线路管理系统sqlserver

BZOJ2004: [Hnoi2010]Bus 公交线路

BZOJ 2004 [Hnoi2010]Bus 公交线路

【BZOJ2004】[HNOI2010]Bus 公交线路

基于高德地图实现的公交线路查询功能

数据结构---公交线路提示系统01

[BZOJ2004] [Hnoi2010]Bus 公交线路

『公交线路状压dp 矩阵乘法加速』

php068公交线路查询系统

2023年全国各城市公交线路与站点

4、【4】公交线路提示 (必做)（图）

python课程设计:公交线路查询系统

国内主要城市：公交线路 - 公交站点矢量数据

【算法面试题干货】公交线路-LeetCode第815题

BZOJ2004 HNOI2010公交线路（状压dp+矩阵快速幂）

使用百度API实现实时公交线路查询及地图显示

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)