Java抓取URL指定的HTML内容 - 代码天地

Java抓取URL指定的HTML内容

编程语言 2018-05-12 17:50:52 阅读次数: 0

通过Java获取到URL指定的内容，如果有目标数据可以再写代码解析获取到的内容

package com.boonya;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.Scanner;

public class WebCapturer {
	
	/**
	 * 根据用户获取的网络地址获取该网页的内容
	 * @param myURL  地址
	 *    如："http://www.google.com.hk/search?q=biao"
	 * @return
	 */
	@SuppressWarnings("resource")
	public static String getHtmlByURL(String myURL){
		URL url=null;
		String htmlContext="";
		try {
			url = new URL(myURL);
			HttpURLConnection conn;
			try {
				conn = (HttpURLConnection) url.openConnection();
				conn.setRequestProperty("User-Agent", // 很重要
						"Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.9.1.2) "
								+ " Gecko/20090803 Fedora/3.5.2-2.fc11 Firefox/3.5.2");
				conn.setRequestMethod("GET");
				Scanner scanner = new Scanner(conn.getInputStream());
				while (scanner.hasNextLine()) {
					htmlContext+=scanner.nextLine();
				}
			} catch (IOException e) {
				e.printStackTrace();
			}
		} catch (MalformedURLException e) {
			e.printStackTrace();
		}
		return htmlContext;
		
	}

	public static void main(String[] args) throws Exception {
		System.out.println(WebCapturer.getHtmlByURL("http://www.google.com.hk/search?q=biao"));
	}
}

猜你喜欢

转载自boonya.iteye.com/blog/1870520

Java抓取URL指定的HTML内容

java中根据url抓取html页面内容的方法

Java获取指定URL页面内容

[Python3.x]网络爬虫（一）：利用urllib通过指定的URL抓取网页内容

Java网络爬虫-2 抓取指定URL网页数据以及解析

使用HtmlAgilityPack抓取html标签属性内容

C#抓取网页HTML内容

BeautifulSoup抓取html内容并输出Markdown

通过url抓取第三方的内容

JAVA爬虫抓取页面的URL数据

PHP抓取网页指定内容（推荐用CURL效率更高）

Java 通过url获取网页内容、生成文件、生成图片（html2image方式）

java读取url字符内容

Java从URL获取PDF内容

python抓取网络图片保存到本地，通过url抓取文章的标题，通过链接地址，抓取内容数据

Java 指定宽度内容居中

Android之博客案例及获取指定URL的网页内容

avascript怎么获取指定url网页中的内容

java替换指定url里的参数值

Java 从网页指定URL获取文件

java解决限制访问指定url

JAVA 获取 URL 指定参数的值

Java 从指定URL下载文件并保存到指定目录

实验：用Unity抓取指定url网页中的所有图片并下载保存

JAVA 通过URL 获取页面内容

java获取请求url中的内容

JAVA翻译HTML网页内容

PHP与HTML结合，在URL里显示表单内容

妹子图url抓取

java读取xml指定标签的内容

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)