Java基于httpclient获取网页数据，实现简单网络爬虫 - 代码天地

Java基于httpclient获取网页数据，实现简单网络爬虫

其他 2018-11-28 16:55:33 阅读次数: 0

1、pom文件引入httpclient依赖

   <dependency>
       <groupId>org.apache.httpcomponents</groupId>
       <artifactId>httpclient</artifactId>
       <version>4.5.3</version>
       </dependency>

2、直接上代码

public static void getInternetData(String url) {
       logger.info("目标网络地址：url="+url);
       //初始化httpclient
       CloseableHttpClient client = HttpClients.createDefault();
       //get方法请求
       HttpGet getMethod = new HttpGet(url);
       //post方法请求
       HttpPost postMethod = new HttpPost(url);
       try {
           //执行响应，初始化response
           CloseableHttpResponse response = client.execute(getMethod);
           //获取响应状态码
           int statusCode = response.getStatusLine().getStatusCode();
           logger.info("访问响应状态码，statusCode="+statusCode);
           //获取实体内容
           String entity = EntityUtils.toString(response.getEntity(),"utf-8");
           logger.info("访问网络响应信息：response="+entity);
           //消耗实体:关闭HttpEntity的流实体
           EntityUtils.consume(response.getEntity());
           response.close();
           client.close();
       } catch (Exception e) {
           logger.info("获取网络数据异常",e);
       }
   }

   public static void main(String[] args) {
       getInternetData("https://cn.bing.com/");
   }

猜你喜欢

转载自blog.csdn.net/weixin_42315600/article/details/84146944

Java基于httpclient获取网页数据，实现简单网络爬虫

JAVA 爬虫获取js动态生成的网页数据

爬虫---获取网页数据的几种方式

JAVA HttpClient模拟网页登录抓取网页数据

JAVA——基于HttpComponents(HttpClient)的简单网络爬虫DEMO

java简单的抓取网页数据

初学爬虫之通过urllib库获取网页数据

Java网络爬虫-2 抓取指定URL网页数据以及解析

利用爬虫爬取简单页码类网页数据

网络爬虫之网页数据解析（XPath）

网络爬虫之网页数据解析（正则re）

网络爬虫之网页数据解析（JSON与JsonPATH）

网络爬虫之网页数据解析（bs4）

HttpClient 模拟登录并解析网页数据

httpClient及jsoup抓取解析网页数据

JAVA网络爬虫（三）：HttpClient获取HTML

无搜索条件根据url获取网页数据(java爬取网页数据)

C# 获取网页数据，WebClient、HttpClient、HttpWebRequest和HttpWebResponse的异步多线程支持详解

C#获取网页数据， WebClient、HttpClient、和HttpWebRequest与HttpWebResponse介绍

采用HttpClient和Jsoup实现简单的网页爬虫

python爬取网页的方法总结,python爬虫获取网页数据

Java网络爬虫 HttpClient

java爬虫之基于httpclient的简单Demo(二)

xpath获取网页数据(一)

xpath获取网页数据(二)

网页数据获取小技巧(小白)

Python网络爬虫实现HTTP请求、解析网页和数据存储（简单静态网页爬取）

python获取数据网页数据并创建文件夹保存（基于python3.6）

Android Jsoup 网络爬虫抓取网页数据---新手学习详细教程！

JAVA爬虫爬取网页数据数据库中,并且去除重复数据

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)