Jsoup简单爬虫实战演练——解析字符串

一个简单页面的代码结构如下:(test.html路径:C:\Users\lenovo\Desktop\test.html)

代码详情:

   /**
     * 解析字符串
     */
    @Test
    public void testString() throws Exception {
        //使用工具类读取文件,获取字符串
        String content = FileUtils.readFileToString(new File("C:\\Users\\lenovo\\Desktop\\test.html"), "utf8");
        //解析字符串
        Document document = Jsoup.parse(content);
        String titleStr = document.getElementsByTag("title").first().text();
        System.out.println(titleStr);
    }

爬取数据的输出结果如下:

 

   解析URL和解析字符串的区别?

   主要的区别就是在解析字符串之前,先用工具类读取文件,获取字符串,之后的解析步骤跟URL并无区别。

发布了83 篇原创文章 · 获赞 63 · 访问量 14万+

猜你喜欢

转载自blog.csdn.net/zqq_2016/article/details/104007545
今日推荐