xpath提取标签文本以及子孙标签文本

说明:xpath中text()只能提取该标签的文本内容,提取子孙标签的文本内容需要用到string()

使用:

"string(xpath的元素定位表达式)"

例子:

from lxml import html
content = '<div>你<a>好</a></div>'
tree = html.fromstring(content)
tree.xpath('string(//div)')

注意定位表达式只定位到该标签,而不是子孙标签。

猜你喜欢

转载自blog.csdn.net/ryuhfxz/article/details/87268875