「Groovy」- 操作 HTML 文档 @20210125 - 代码天地

「Groovy」- 操作 HTML 文档 @20210125

其他 2021-01-29 12:53:15 阅读次数: 0

问题描述

在 Jenkins Pipeline 中，我们需要对 HTML 文档进行多种操作。之前使用 XMLParser 及 XMLSlurper 库操作 HTML 文档时遇到很多问题，因为 HTML 文档结构松散（比如没有结束标签等等），不是标准的 XML 文件，因此导致 XML 解析失败。

我们现在使用 Jsoup 操作 HTML 文档，该笔记将整理：使用 Jsoup 操作 HTML 文档的常用方法

相关链接

项目主页：jsoup Java HTML Parser, with the best of HTML5 DOM methods and CSS selectors.
获取文档的 DOM 对象：Parsing and traversing a Document: jsoup Java HTML parser
使用选择器选择元素：Use selector-syntax to find elements: jsoup Java HTML parser
元素的查找、获取、操作：Use DOM methods to navigate a document: jsoup Java HTML parser

简单的入门示例

@Grab(group='org.jsoup', module='jsoup', version='1.10.1')
import org.jsoup.Jsoup

def htmlString = "<html><head><title>Title of Page</title></></head></html>"
def htmlDocument = Jsoup.parse(htmlString)
println htmlDocument.getElementsByTag("title").text()

注意事项

如果可能，尽量不要使用任何 XML 类库操作 HTML 文本。

参考文献

WikiNotes/操作 HTML 文档
 Html Slurping in Groovy
Use DOM methods to navigate a document

猜你喜欢

转载自blog.csdn.net/u013670453/article/details/113133353

「Groovy」- 操作 HTML 文档 @20210125

# 2020/09/17 #「Groovy」- 操作 HTML 文档

# 2020/09/20 #「Groovy」- 操作 HTML 文档

groovy官方文档

python操作数组的extend()和append()的区别_20210125

javascript DOM操作HTML文档

HTML jQuery 文档操作 - html() 方法

4: ES内执行Groovy脚本，做文档部分更新、执行判断改变操作类型

Groovy JSON XML操作

Groovy的入门语法操作

Groovy对xml的操作

Groovy操作复制文件

Groovy中对Json的操作

groovy List 常用操作

groovy json操作

groovy xml操作

Groovy重载操作符

周记-20210125

HTML文档

使用 jsoup 对 HTML 文档进行解析和操作

jQuery 文档操作 - appendTo() 方法---动态加HTML 元素

web_day13_jquery对HTML文档的操作

groovy

groovy文件操作工具类

groovy之使用List操作符

Groovy中的操作符重载

20210125Java基本语法

「Kanboard」- 个人看板工具 @20210125

java对word文档的操作-直接操作或poi工具包或freemarker+xml或html转word

文档操作

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)