Hello,我是 Alex 007,一个热爱计算机编程和硬件设计的小白,为啥是007呢?因为叫 Alex 的人太多了,再加上每天007的生活,Alex 007就诞生了。
文章目录
一、正则表达式
二、XPATH
解析
xpath解析是我们在爬虫中最常用也是最通用的一种数据解析方式,由于其高效且简介的解析方式受到了广大程序员的喜爱。在后期学习scrapy框架期间,也会再次使用到xpath解析。
pip install lxml
使用通用爬虫爬取网页数据
实例化etree对象,且将页面数据加载到该对象中
使用xpath函数结合xpath表达式进行标签定位和指定数据提取
属性定位:
#找到class属性值为song的div标签
//div[@