网络爬虫-通过百度百科查询行政区划代码 - 代码天地

网络爬虫-通过百度百科查询行政区划代码

其他 2018-07-11 14:49:22 阅读次数: 0

纯属练手

import  requests
import  re
from requests.exceptions import RequestException


def get_page(url):
    try:
        res=requests.get(url)
        res.encoding = 'utf-8'
        if res.status_code==200:
            return res.text
        else:
            return None
    except RequestException:
        return  None
def parse_page(html):
        pattern=re.compile('<h1 >(.*?)</h1>.*?(区码代码|行政代码).*?basicInfo-item value">\n(.*?)(<sup>|\n).*?</dd>',re.S)
        #pattern=re.compile('(.*?)<sup>',re.S)
        result=re.findall(pattern,html)
        print(result)
        #return result
        if result !=[]:
            return  {
                'Code':result[0][2]
                ,'Rname':result[0][0]
                }
        else:
            return {
                'Code':''
                ,'Rname':''
                }
def main():
    List=['龙门县','遂溪县','广州市','从化市','万山海洋开发试验区','aaa']
    codes=[]
    for c in List:
        html=get_page('http://baike.baidu.com/item/'+str(c))
        code=parse_page(html)
        code['Qname']=c
        codes.append(code)
    print(codes)
if __name__ == '__main__':
    main()

猜你喜欢

转载自blog.csdn.net/cakecc2008/article/details/62046142

网络爬虫-通过百度百科查询行政区划代码

百度地图行政区划遮罩+描点+信息窗demo

百度地图获取县级行政区划数据，不用密钥

百度地图api初使用，行政区划及搜索

百度地图API生成厦门区级行政区划图

百度地图获取行政区划svg格式

百度地图显示行政区划/自定义覆盖物示例

纯手工生成乡镇行政区划(街道行政区划) geojson 用于百度echart绘图不断更新...

利用百度API获取最新百度行政区划边界线（包括海域）

Python：通过百度地图API快速获取路对应的行政区域

利用Echarts+百度地图API绘制可交互的行政区划地图（2021）

行政区划代码

vue-baidu-map 绘制行政区划的轮廓，添加行政区划名称（含给覆盖物添加点击事件）——vue 百度地图开发

怎么使用水经注万能地图下载器制作百度行政区划个性化地图

天地图-行政区划-爬虫

行政区划

全国行政区划代码SQL

全国行政区划代码表

爬百度百科黄渤的爬虫

百度百科多线程爬虫(Java)

即席查询-摘自百度百科

python网络爬虫批量获取百度百科词条使用request和beautifulsoup

百度百科与维基百科

vue-baidu-map 综合案例 | 绘制行政区划轮廓，缩放切换市、区视图、点击高亮行政区划，搜索标记目标点，自定义地图样式等——vue百度地图开发

行政区划获取

nginx 百度百科

Hibernate百度百科

struts百度百科

百度百科

Spring 百度百科

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)