路飞学城—python爬虫实战密训-—第1章 - 代码天地

路飞学城—python爬虫实战密训-—第1章

其他 2018-07-04 23:15:46 阅读次数: 0

一.本节学习体会，心得：

因为之前只是看了Python基础的内容，以为爬虫的内容自己会看不懂，但是视频里的老师讲得很好，生动易懂。
学习编程，就要亲自练习，看视频觉得懂了，自己亲自做起来，就有了一点阻碍。

二.知识点总结：

爬虫定义：通过程序去获取网页上自己想要的数据，也就是自动抓取数据。爬虫通过分析html代码，从中获取文本，图片，视频.....
发送请求用http request，在这个歌之前要安装requests 和bs4 模块，在控制台窗口里用 pip install 模块名来进行安装。
request请求中包含，请求头，请求体，method:url:params:data:json:headers:cookies。

爬取汽车之家新闻练习

import requests
from bs4 import BeautifulSoup
ret = requests.get(url="https://www.autohome.com.cn/news/")
ret.encoding = ret.apparent_encoding
# print(ret.text)
soup = BeautifulSoup(ret.text,'html.parser')
div = soup.find(name='div',id='auto-channel-lazyload-article')
li_list = div.find_all(name='li')
for li in li_list:
    h3 = li.find(name='h3')
    if not h3:
        continue
   

    p = li.find(name='p')
  

    a = li.find(name='a')
  

    img = li.find('img')
    src = img.get('src')

    file_name = src.rsplit('__',1)[1]
    print(file_name)
    ret_img = requests.get(
        url= 'https:'+src
    )
    with open(file_name,'wb') as f:
        f.write(ret_img.content)

猜你喜欢

转载自www.cnblogs.com/andydong/p/9265831.html

路飞学城—python爬虫实战密训-—第1章（作业）

路飞学城-Python爬虫实战密训-第1章

路飞学城—python爬虫实战密训-—第1章

路飞学城-Python爬虫实战密训-第2章

路飞学城-Python爬虫实战密训-第3章

路飞学城-——Python爬虫实战密训-——第2章

路飞学成-Python爬虫实战密训-第1章

路飞学城—Python—爬虫实战密训班第二章

路飞学城—Python—爬虫实战密训班第三章

路飞学城—Python—爬虫实战密训班第一章

路飞学城—Python爬虫实战密训班第三章

路飞学成-Python爬虫实战密训-第2章

路飞学成-Python爬虫实战密训-第3章

路飞学院-Python爬虫实战密训班-第1章

路飞学城-Python爬虫集训-第1章

路飞学城-python爬虫密训-第二章

路飞学城-python爬虫密训-第一章

路飞学城-python爬虫密训-第三章

路飞学院-Python爬虫实战密训班-第2章

路飞学院-Python爬虫实战密训班-第3章

路飞学城-python开发集训-第1章

路飞学城－Python开发集训_第1章

路飞学城-Python爬虫集训-第二章

路飞学城-Python开发集训-第2章

路飞学城-Python开发集训-第3章

路飞学城-Python开发集训-第4章

路飞学城-Python开发集训-第5章

路飞学城-Python开发集训-第2章（2）

路飞学城爬虫实战笔记（三）

路飞学城爬虫实战笔记（二）

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)