python爬虫学习（十五）xpath模板下载 - 代码天地

python爬虫学习（十五）xpath模板下载

其他 2020-03-26 15:02:02 阅读次数: 0

# -*- coding: utf-8 -*-
import requests
from lxml import etree
import os
if __name__ == '__main__':
     headers = {
         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'
     }
     url='http://sc.chinaz.com/jianli/free.html'
     page_text=requests.get(url=url,headers=headers).text
     tree = etree.HTML(page_text)
     div_list=tree.xpath('//div[@id="main"]/div/div')

     if not os.path.exists('./muban'):
         os.mkdir('./muban')

     url_list=[]
     name_list=[]
     for div in div_list:

         muban_href= div.xpath('./a/@href')[0]
         #print(muban_href)
         download_url = requests.get(url=muban_href,headers=headers).text
         #print(download_url)
         download_tree = etree.HTML(download_url)
         name=download_tree.xpath('//div[@class="bread clearfix"]/a[3]/text()')[0]+'.rar'
         download_name = name.encode('iso-8859-1').decode('utf-8')
         #print(download_name)
         download_url = download_tree.xpath('//div[@class="clearfix mt20 downlist"]/ul/li[1]/a/@href')
         url_list.append(download_url)
         name_list.append(download_name)

     for name,url in zip(name_list,url_list):
         print(name,url)

发布了23 篇原创文章 · 获赞 0 · 访问量 666

私信关注

猜你喜欢

转载自blog.csdn.net/haimian_baba/article/details/103820485

python爬虫学习（十五）xpath模板下载

python爬虫-简单使用xpath下载图片

python 爬虫（xpath解析网页，下载照片）

python爬虫学习之XPath基本语法

Python爬虫学习笔记（四）————XPath解析

xpath下载安装——Python爬虫xpath插件下载安装（2023.7亲测可用！！）

python爬虫系列之 xpath实战：批量下载壁纸

python爬虫-XPath实例——批量下载高清壁纸

Python爬虫-xpath

python 爬虫 XPath

python爬虫xpath的语法

python爬虫 xpath使用

python爬虫---XPath介绍

python爬虫(二)-------------------Xpath

python爬虫教程：Xpath

python笔记(爬虫 xpath)

python爬虫xpath教程

Python爬虫--Xpath（二）

Python爬虫--Xpath

【python爬虫】Xpath

python爬虫基础 - XPATH

python爬虫之xpath

Python爬虫：xpath解析

python爬虫-xpath解析

python爬虫学习test2-学习beautifulsoup、学习xpath

python爬虫之Xpath和lxml学习笔记03

xpath语法和lxml模块（数据提取）----python爬虫学习

Python爬虫基础——XPath语法的学习与lxml模块的使用

Python爬虫学习笔记(XPath选择器【推荐】)

python爬虫学习（十四）xpath获取不同标签城市名

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)