java小作业(十八)

1.利用common-io和jsoup去爬凤凰网 实现能够将新闻的标题和内容写入到D:\\zp\\xieru.txt中

package com.sj.homework;

import java.io.File;
import java.io.IOException;

import org.apache.commons.io.FileUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

/**
 * @desc	利用common-io和jsoup去爬凤凰网 实现能够将新闻的标题和内容写入到E:\\zp\\xieru.txt中
 * @author 	ws
 * @time	8.15
 */
public class Test {
	public static void main(String[] args) throws IOException {
		String urlPath = "http://news.ifeng.com/a/20180815/59831553_0.shtml";//html路径
		Document document = Jsoup.connect(urlPath).post();//获取文档对象
		String yc_tit_txt = document.getElementsByTag("h1").text();//获取标题文本
		
		String yc_con_txt = document.getElementById("yc_con_txt").text();//获取内容文本
		
		String filePath = "E:/zp/xieru.txt";//存放文件路径
		String str = "标题:\n\t"+yc_tit_txt+"\n内容:\n\t"+yc_con_txt;//存放文件的内容
		File file = new File(filePath);//文件添加到内存
		FileUtils.write(file, str);//写入文件
		System.out.println("写入成功");//写入结果输出控制台
	}
}


2.利用common-io实现对xieru.txt进行逐行读取并将结果输出在控制台上

package com.sj.homework;

import java.io.File;
import java.io.IOException;
import java.util.List;

import org.apache.commons.io.FileUtils;

/**
 * @desc	利用common-io实现对xieru.txt进行逐行读取并将结果输出在控制台上
 * @author 	ws
 * @time	8.15
 */
public class Test2 {
	public static void main(String[] args) throws IOException {
		String path = "E:/zp/xieru.txt";//文件路径
		File file = new File(path);//写入内存
		List<String> list = FileUtils.readLines(file, "UTF-8");//读取每行,存入list
		for (String every : list) {//foreach逐个输出在控制台
			System.out.println(every);
		}
	}
}


3.利用common-io和jsoup去爬取该url=http://news.ifeng.com/a/20180814/59812253_0.shtml,计算一下当前网页中出现了多少次抖音,并将结果输出在控制台上

package com.sj.homework;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

/**
 * @desc	利用common-io和jsoup去爬取该url=http://news.ifeng.com/a/20180814/59812253_0.shtml,
 * 			计算一下当前网页中出现了多少次抖音,并将结果输出在控制台上
 * @author 	ws
 * @time	8.15
 */
public class Test3 {
	public static void main(String[] args) throws IOException {
		String url = "http://news.ifeng.com/a/20180814/59812253_0.shtml";//html路径
		Document element = Jsoup.connect(url).post();//获取文档
		String str = element.text();//获取字符串类型的文档
		int num = str.split("抖音").length-1;//分隔抖音字符,获取出现次数
		System.out.println("抖音出现的次数为:"+num);//结果输出在控制台
	}
}

猜你喜欢

转载自blog.csdn.net/qq_40923411/article/details/81710591