1.利用common-io和jsoup去爬凤凰网 实现能够将新闻的标题和内容写入到D:\\zp\\xieru.txt中
package com.sj.homework;
import java.io.File;
import java.io.IOException;
import org.apache.commons.io.FileUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
/**
* @desc 利用common-io和jsoup去爬凤凰网 实现能够将新闻的标题和内容写入到E:\\zp\\xieru.txt中
* @author ws
* @time 8.15
*/
public class Test {
public static void main(String[] args) throws IOException {
String urlPath = "http://news.ifeng.com/a/20180815/59831553_0.shtml";//html路径
Document document = Jsoup.connect(urlPath).post();//获取文档对象
String yc_tit_txt = document.getElementsByTag("h1").text();//获取标题文本
String yc_con_txt = document.getElementById("yc_con_txt").text();//获取内容文本
String filePath = "E:/zp/xieru.txt";//存放文件路径
String str = "标题:\n\t"+yc_tit_txt+"\n内容:\n\t"+yc_con_txt;//存放文件的内容
File file = new File(filePath);//文件添加到内存
FileUtils.write(file, str);//写入文件
System.out.println("写入成功");//写入结果输出控制台
}
}
2.利用common-io实现对xieru.txt进行逐行读取并将结果输出在控制台上
package com.sj.homework;
import java.io.File;
import java.io.IOException;
import java.util.List;
import org.apache.commons.io.FileUtils;
/**
* @desc 利用common-io实现对xieru.txt进行逐行读取并将结果输出在控制台上
* @author ws
* @time 8.15
*/
public class Test2 {
public static void main(String[] args) throws IOException {
String path = "E:/zp/xieru.txt";//文件路径
File file = new File(path);//写入内存
List<String> list = FileUtils.readLines(file, "UTF-8");//读取每行,存入list
for (String every : list) {//foreach逐个输出在控制台
System.out.println(every);
}
}
}
3.利用common-io和jsoup去爬取该url=http://news.ifeng.com/a/20180814/59812253_0.shtml,计算一下当前网页中出现了多少次抖音,并将结果输出在控制台上
package com.sj.homework;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
/**
* @desc 利用common-io和jsoup去爬取该url=http://news.ifeng.com/a/20180814/59812253_0.shtml,
* 计算一下当前网页中出现了多少次抖音,并将结果输出在控制台上
* @author ws
* @time 8.15
*/
public class Test3 {
public static void main(String[] args) throws IOException {
String url = "http://news.ifeng.com/a/20180814/59812253_0.shtml";//html路径
Document element = Jsoup.connect(url).post();//获取文档
String str = element.text();//获取字符串类型的文档
int num = str.split("抖音").length-1;//分隔抖音字符,获取出现次数
System.out.println("抖音出现的次数为:"+num);//结果输出在控制台
}
}