关于lxml 格式化后，如何输出源代码的问题

其他 2019-05-07 12:50:54 阅读次数: 0

在工作中遇到问题就是用lxml匹配出来，得出的结果是

[<Element div at 0x2d616dd48c8>]

我需要把他格式化出来，然后用lxml的一个方法

from lxml import html
content = html.tostring(content[0])

得出格式化后的结果，是bytes类型，我们需要转str

content =  str(content, encoding = "utf-8")
#转str后发现不是中文，我们需要python 再带的库html 转一下就ok
import html
content = html.unescape(content)

就这样轻松格式化出想要的内容了。如有错误请指出，谢谢。

猜你喜欢

转载自blog.csdn.net/yang_bingo/article/details/88693668

关于lxml 格式化后，如何输出源代码的问题

关于python安装lxml插件的问题

【原创】关于lxml读取文件后不能正常输出中文

关于 conda中的 lxml 无法导入 etree 问题

关于格式化输出

关于vscode更新后格式化代码造成函数括号后的空格被删除，单引号变双引号问题的解决方法

JS关于Date函数的格式化输出

关于C语言里格式化小数输出

关于python中的json进行格式化的输出

python-------关于字符串格式化输出

关于json格式化输出json.MarshalIndent()的使用

关于使用JS获取当前时间并格式化输出

lxml

关于windows上安装lxml失败

vscode关于ESLint代码格式化的设置

关于VS Code配置Java代码格式化的方法！

使用lxml解析HTML代码

如何快速上手lxml

关于SimpleDateFormat时间格式化线程安全问题

VSCode-关于自动格式化问题

lxml etree对存在的xml添加新节点，新节点没有排版格式化

关于Eclipse中格式化代码快捷键失效以及自动补全功能的问题

关于printf格式化输出函数后面f的作用和对printf函数的总结

Python-day01-关于变量，格式化输出，交互

Java关于数组转化成格式化的字符串输出

ESP8266-学习点滴（5）关于格式化输出的那点事

python 安装lxml后import失败

eclipse java源代码格式化

关于导入lxml，出现image not found的解决方法。

python接口自动化--lxml解析

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)