爬取福州地区职位数据 - 代码天地

爬取福州地区职位数据

其他 2020-03-17 21:01:13 阅读次数: 0

从网页源代码中找到我们需要爬取的标签且是html结构，爬取目标为class=’job_titile'和class='job_content'

import requests
from bs4 import BeautifulSoup
import bs4
import pandas as pd #引用工具
url = 'http://fj.huatu.com/zt/2019zwb/diqu/1.html'
def job(s):#定义函数
    try:
        headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}
        r=requests.get(s,timeout=30,headers=headers)#发送get请求
        r.raise_for_status()
        r.encoding=r.apparent_encoding#统一编码
        soup=BeautifulSoup(r.text,'lxml')#使用BeautifulSoup库
        return soup
    except:
        return ""#出现错误，返回空字符串
soup=job(url)
a=[]#定义两个空列表
b=[]
for link1 in soup.find_all('div',class_='job_content'): #使用find_all函数查找标签
    b.append(link1.get_text())
for link2 in soup.find_all('div',class_='job_title'):
    a.append(link2.get_text().strip())
data=pd.DataFrame([a,b],index=["目录","职位"])#使用DataFrame可视化
print("福州地区职位数据:","\n")#使用print函数打印
print(data)

爬取结果如图

猜你喜欢

转载自www.cnblogs.com/hr1347114782/p/12509357.html

爬取福州地区职位数据

拉勾网职位数据爬取

拉勾网职位数据爬取与分析（一）

node 爬虫实战 - 爬取拉勾网职位数据

python爬取拉勾职位数据并对其进行分析

拉勾网职位数据爬取--按公司规模爬取

爬虫黑科技，我是怎么爬取indeed的职位数据的

某联-职位数据爬取及可视化分析

Python使用Scrapy框架爬取某网站职位数据并存放到MySQL数据库（支持二级页面爬取）

crawlspider 爬取51job nlp北京地区的职位并保存到mongo

Python爬取拉勾网数据分析职位

二十六、爬取拉钩网Python职位的数据

爬取tencent职位招聘的

scrapy爬取python职位

#python学习笔记#使用python爬取拉勾网职位信息（二）：爬取数据

python：地区邮编的爬取

写爬虫爬了3w条职位数据，看看当前招聘形势 | 开源

对拉勾网职位信息的爬取（python）

爬取爱笔智能招聘职位

爬取爱笔智能招聘职位

爬取51job职位信息

python爬取腾讯招聘的职位

Python爬取实习僧职位信息

用Python爬取拉勾网数据分析职位及数据可视化

拉勾网‘数据分析师’职位招聘信息数据爬取

爬取北京地区的租房信息

爬取厦门地区职务表

python爬取地区天气情况

python爬虫：爬取拉勾网北京数据挖掘职位并分析

拉勾网爬取全国python职位并数据分析薪资，工作经验，学历等信息

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)