爬虫的第一个入门程序day01 - 代码天地

爬虫的第一个入门程序day01

其他 2020-02-17 11:28:16 阅读次数: 0

爬虫的第一个入门程序day01

#环境准备：

JDK1.8
Intellij IDEA
IDEA自带的Maven

**
具体过程

创建Maven工程itcast-crawer-first并给pom.xml加入依赖

<!-- https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient -->
<dependency>
    <groupId>org.apache.httpcomponents</groupId>
    <artifactId>httpclient</artifactId>
    <version>4.5.3</version>
</dependency>

<!-- https://mvnrepository.com/artifact/org.slf4j/slf4j-log4j12 -->
<dependency>
    <groupId>org.slf4j</groupId>
    <artifactId>slf4j-log4j12</artifactId>
    <version>1.7.25</version>
    <scope>test</scope>
</dependency>

创建一个log4j.properties（打印日志）

log4j.rootLogger=DEBUG,A1
log4j.logger.cn.itcast = DEBUG
log4j.appender.A1=org.apache.log4j.ConsoleAppender
log4j.appender.A1.layout=org.apache.log4j.PatternLayout
log4j.appender.A1.layout.ConversionPattern=%-d{yyyy-MM-dd HH:mm:ss,SSS} [%t] [%c]-[%p] %m%n

开始第一个最简单的爬虫，爬取百度首页：http://www.baidu.com

public static void main(String[] args) throws Exception {
    CloseableHttpClient httpClient = HttpClients.createDefault();
    HttpGet httpGet = new HttpGet("http://www.baidu.com");
    CloseableHttpResponse response = httpClient.execute(httpGet);
    if (response.getStatusLine().getStatusCode() == 200) {
        String content = EntityUtils.toString(response.getEntity(), "UTF-8");
        System.out.println(content);
    }
}

爬取结果：
在这里插入图片描述

在这里插入图片描述

春来花自青@向阳花开

发布了8 篇原创文章 · 获赞 13 · 访问量 236

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_44228113/article/details/103866636

爬虫的第一个入门程序day01

七天快速入门Python | day01 | 第一个Python程序

安卓基础学习 Day01 |第一个安卓应用程序：Hello Word!

小汤学编程之JAVA基础day01——JAVA基本概念、第一个JAVA程序

python 爬虫《百炼成佛》爬虫入门（爬虫介绍）第一个爬虫程序

第一个入门程序

Python爬虫入门——2. 1 我的第一个爬虫程序

爬虫简单入门：第一个简单爬虫

学习笔记(01):C++入门课程-第一个程序

学习笔记(01):C#急速入门-我的第一个Hello，World程序

ThreeJs 入门(01)-编写第一个three.js程序

Go语言入门到实战——01.第一个HelloWorld程序

Java快速入门笔记-01 HelloWorld分析第一个java程序

LInux C++学习day01 C++语言概述第一个C++程序名字空间(namespace) C++的结构体、联合体和枚举字符串

python-入门的第一个爬虫例子

Scrapy入门-第一个爬虫项目

html_01_第一个html程序

python01 第一个python程序

Springboot01创建第一个程序

01--第一个flask程序

java_01安装与第一个程序

我的第一个成功的爬虫程序

python篇-第一个爬虫程序

重写第一个爬虫程序

python第一个爬虫程序

第一个get请求的爬虫程序

纪念跑通的第一个爬虫程序

第一个python程序：爬虫下载课件

（一）Mybatis入门之第一个程序

springboot（一）：第一个入门程序

今日推荐

周排行

(BIND最佳实践)Linux运维最佳实践

makefile ifeq之坑: 1. syntax error near unexpected token 2. *** missing separator. Stop.

easyui datagrid操作栏内置图片按钮

SQLyog连接MySQL时出现的2058错误解决方法

linux音频开发

hashcode方法简析

SpringBoot中使用Transaction注解遇到的坑

逆战-CSS中子元素在父元素中的4种水平垂直居中方法

Expression.Blend.4 Chapter 图片和视频的使用

springMVC返回void值

每日归档

更多

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)