Java解析html文本 - 代码天地

Java解析html文本

其他 2018-09-03 23:59:58 阅读次数: 0

　　公司是前后端分离的架构，有个功能前端使用了富文本编辑器，通过该富文本编辑器得到的html文本与实际要求有一定差距，但是前端又处理不了，因此该处理只能由我们后端处理了。
　　第一想法是通过处理XML文档的方式处理前端传来html文本，由于前端传来的html文本并不是规范的XML，因此只能考虑其他方法。
　　后来发现Jsoup可以解析html文本，解决了问题。

class Test {
    public static void main(String[] args) {
        // 获取html文档。
        Document document = Jsoup.parse("<img><img>");
        // 拿到全部img标签，并设置src属性
        Iterator<Element> imgs = document.select("img").iterator();
        while (imgs.hasNext()) {
            Element img = imgs.next();
            img.attr("src", "http://xxx.com");
        }
        System.out.println(document);
    }
}

输出结果

<html>
 <head></head>
 <body>
  <img src="http://xxx.com" />
  <img src="http://xxx.com" />
 </body>
</html>

猜你喜欢

转载自blog.csdn.net/weixin_38229356/article/details/82154572

Java解析html文本

HtmlParserUtil 解析HTML文本

HTML:超文本标记语言解析

小程序解析富文本html内容

laravel把markdown文本解析为html元素

jsoup——java解析html

java html解析

java解析html

java HTML 解析

java解析html的table

JAVA 解析HTML过程

java(一) - 关于文本解析

【JAVA】java解析HTML代码

Java解析html常用的工具

Java解析HTML之NekoHTML

java解析本地html文件

Java爬虫+html网页解析

[OC] 富文本 AttributedString 以及用富文本解析html文本

微信小程序如何解析HTML富文本（使用wxParse解析富文本的demo）

微信小程序之HTML富文本解析，编辑器文本解析

Java去除文本中的HTML标签

java后端移除文本中的html标签

Java实现从Html文本中提取纯文本

微信小程序之HTML富文本解析

HTMLParser 解析html字符串，提取纯文本

三十、小程序解析HTML(对富文本返回数据的处理)

python爬虫之不规则html文本解析

Vue - 解析富文本（v-html 指令）

关于java解析文本文档

HTML文本

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)