python3批量抓取电影天堂下载链接 - 代码天地

python3批量抓取电影天堂下载链接

其他 2019-01-10 11:00:56 阅读次数: 0

版权声明：本文为博主原创文章，转载请注明出处。 https://blog.csdn.net/qq_17054989/article/details/80087341

1.思路分析

首先打开电影天堂的列表页

右键审查元素查看电影简介的链接

将此链接打开可以得到下载地址

可能是爬虫原因网站审查元素和用request得到的数据不一样，因此代码的正则表达式会改变

加上列表循环便可以批量输出下载链接

2.代码

#!/usr/bin/env python
#-*-coding:utf-8-*-
__author__ = 'Qi zewen QQ群497719008'

import requests
import re
# import time
#批量爬取电影天堂电影下载链接
for n in range(1,175):
    a_url = 'http://www.dytt8.net/html/gndy/dyzz/list_23_'+str(n)+'.html'                #网站地址
    html_1 = requests.get(a_url)                    #连接到网站，返回状态码
    html_1.encoding='gb2312'                        #改变网站编码为中文gb2312
    # print(html_1.text)
    detail_list=re.findall('<a href="(.*?)" class="ulink',html_1.text)    #findall匹配正则表达式和网站代码获取 .text
    # print(detail_list)
    for m in detail_list:
        # time.sleep(0.2)
        # b_url = 'http://www.dytt8.net/{}'.format(m)
        b_url = 'http://www.dytt8.net/%s'%m
        html_2=requests.get(b_url)
        html_2.encoding='gb2312'
        # print(html_2.text)
        ftp = re.findall('<a href="(.*?)">ftp.*?</a></td>',html_2.text)
        if ftp != []:
            print (ftp[0])
        with open('dn.txt','a',encoding='utf-8') as f:
            #写文本write到本地
            if ftp != []:
                f.write(ftp[0]+'\n')

猜你喜欢

转载自blog.csdn.net/qq_17054989/article/details/80087341

python3批量抓取电影天堂下载链接

python3 电影天堂抓取

使用python3批量下载rbsp数据

使用python3批量下载网站图片

Python3批量下载.dat和.hea文件

实例练习----电影天堂抓取下载链接

python3批量为文件重命名

Python3批量转换文件编码

python3批量telnet脚本

Python3批量处理域名解析

python3抓取电影天堂存mysql出错如何解决？（已解决）

python3 爬取电影天堂最新电影

Python3批量修改文件名脚本

Python3批量合并excel 格式xlsx和xls都行

Python3批量修改文件名小工具

20230507使用python3批量转换DOCX文档为TXT

爬取电影天堂最新电影的名称和下载链接

20230508在Ubuntu22.04下使用python3批量转换DOCX文档为TXT

20230811在WIN11下使用python3批量将中英文的SRT格式的字幕合并

20230809在WIN10下使用python3批量将TXT文件转换为SRT文件

python3 爬虫抓取豆掰电影TOP 250

[Java] 用java实现的电影天堂,飘花电影网的电影的下载地址抓取

爬虫学习（一）---爬取电影天堂下载链接

网页视频解密下载 TS解密下载 M3U8批量下载

python3 抓取简书，增加浏览量

python爬虫——爬取电影天堂磁力链接

Python笔记6——爬取电影天堂链接

一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接

[云炬python3玩转机器学习笔记] 2-4批量学习、咋西安学习、参数学习和非参数学习

电影天堂python脚本

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)