金三银四好时节,python面试10K+能不能得到?

嗨害大家好鸭!我是小熊猫~

在这里插入图片描述

金三银四好时节,面试10K+能不能得到?

这次正逢面试季,这次给大家带来一个真实面试题

虽然最后上的班不一定是自己喜欢的,

但是工作还是要有哇!


第三方库:

  • requests >>> pip install requests

  • parsel >>> pip install parsel

安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车

  2. 在pycharm中点击Terminal(终端) 输入安装命令


开发环境:

  • 版 本: python 3.8

  • 编辑器: pycharm 2021.2

在这里插入图片描述

540305994


原理:

模拟 浏览器 向 服务器 发送网络请求(访问网站)


基本思路

实现案例:

分析数据来源

静态页面(数据来源 = 当前浏览器里面的网址)

代码实现:

1.发送请求

2.获取数据

3.解析数据(我需要的内容取出来 餐厅名称 评分 评价人数 地址 电话)

4.保存数据


代码展示

导入模块

# Python里面有非常多的第三方工具
# 内置工具也有很多
import requests         # 发送请求 第三方模块
import parsel           # 解析数据 第三方模块

伪装 Python 字典容器

在这里插入图片描述

list_html = requests.get(url=url_, headers=headers).text
list_select = parsel.Selector(list_html)
link_list = list_select.css('.bGnIM .OhCyu span a::attr(href)').getall()
for link in link_list:

在这里插入图片描述

发送请求

    response = requests.get(url=url, headers=headers)

获取数据

    html_data = response.text

解析数据

:nth-child(3): 选择第几个标签 采集多页内容

###无偿领python源码籽料qun:5403 05994
    selector = parsel.Selector(html_data)
    store_name = selector.css('.fHibz::text').get()
    comment_count = selector.css('.eSAOV.H3:nth-child(2) .eBTWs::text').get()
    address = selector.css('.eSAOV.H3:nth-child(3) .dyeJW.dUpPX:nth-child(1) a::text').get()
    phone = selector.css('.eSAOV.H3:nth-child(3) .dyeJW.dUpPX:nth-child(2) a::text').get()
    score = selector.css('.eEwDq .fdsdx::text').get()
    print(store_name, comment_count, address, phone, score)

最后不管是面没面成,

咱只要有技术,

就不会怕面不上!

我是小熊猫,咱下篇文章再见啦(✿◡‿◡)

猜你喜欢

转载自blog.csdn.net/m0_67575344/article/details/131265119
今日推荐