1 : xpath 跟re, bs4, pyquery一样, 都是页面数据提取的方法, 根据元素的路径来查找页面元素
2 : xpath是基于 lxml 来实现的, 所以, 使用前应该先安装 lxml 使用命令 pip install lxml
3 : 导入需要用到的模块
from lxml.html import etree
4: 示例
5 : 用到的模块
[1] : obj = etree.fromstring(html)
[2] : //ul : 从obj对象中查找ul, 不考虑ul的位置(//)
/li : 找到ul下边的li, 不包含后代元素
[@class="one"] : 给标签设置属性, 用于过滤和筛选
//text() : 获取所有后代元素的文本内容
/text() : 获取直接子元素的文本内容, 不包含后代元素
xpath 返回的是一个列表