Spider学习笔记（二）:抓取51招聘城市信息 - 代码天地

Spider学习笔记（二）:抓取51招聘城市信息

其他 2018-08-29 18:11:20 阅读次数: 0

import requests
import lxml
from lxml import etree

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36"
}

cityUrl = 'https://jobs.51job.com/'

def getCity(url):
    response = requests.get(url,headers=headers)

    html = response.content.decode('gbk')

    mytree = lxml.etree.HTML(html)

    cityList = mytree.xpath('/html/body/div[2]/div[2]/div[2]/div[1]/a')
    for city in cityList:
        cityName = city.xpath('./text()')[0]
        cityUrl = city.xpath('./@href')[0]
        print(cityName,cityUrl)

if __name__ == '__main__':

    getCity(cityUrl)

猜你喜欢

转载自blog.csdn.net/xiaohuoche175/article/details/81749104

Spider学习笔记（二）:抓取51招聘城市信息

Spider学习笔记（三）:抓取51招聘岗位信息

Spider学习笔记（五）:抓取51所有城市所有招聘信息（每个城市的每一页）

一周招聘信息汇总

深度学习排序在58招聘搜索场景的演进

通过猎聘的招聘信息找出学习线路规划

Python爬虫框架Scrapy实战 - 抓取BOSS直聘招聘信息

DEDE5.5招聘模板

58招聘电话反爬

网易2020招聘编程题

华为2020招聘笔试 8.27号场第二道

python抓取招聘信息

爬取boss直聘招聘信息

爬取猎聘网招聘信息

BOSS直聘招聘信息爬取

爬取某招聘网站的招聘信息（猎聘）

BeautifulSoup4：抓取腾讯社招页面的招聘信息

转——Python爬虫抓取大数据岗位招聘信息（51job为例）

又是一年招聘会

滴滴打车2017招聘笔试题

美团2016招聘笔试奇数位丢弃

爬虫_抓取51job招聘数据

51学习笔记《二》

spider数据抓取（第二章）

tencnet社招信息抓取

rvest包爬取猎聘网招聘信息

Python 3.6 优雅的爬取猎聘网招聘信息

OkHttp+Jsoup爬Boss直聘招聘信息

Python3爬取猎聘网招聘信息

python 爬取boss直聘招聘信息实现

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)