python爬虫煎蛋网妹子图2（代码） - 代码天地

python爬虫煎蛋网妹子图2（代码）

编程语言 2018-06-05 11:30:30 阅读次数: 3

——————来自某潮汕人的菜鸟教程

import requests
import re
import base64

def base64_decode1(s):
    s = s.encode()
    missing_padding = len(s) % 4
    if missing_padding != 0:
        s += b'=' * (4 - missing_padding)
    return base64.decodestring(s)

def get_info(url):
    '''返回下一页网页的URL和当前网页每个图片的img_hash
        当flag=0时还有下一页，1时没有下一页
    '''
    next_pages_url=''
    result=requests.get(url=url).text

    flag=0
    try:
        next_pages_url=re.findall('<a title="Older Comments" href="(.*?)"',result,re.DOTALL)[0]
    except:
        print('超过源网站的下载页数')
        flag=1
    img_hash=re.findall('<span class="img-hash">(.*?)</span></p>',result,re.DOTALL)
    print(next_pages_url)
    print(img_hash)
    return 'http:'+next_pages_url,img_hash,flag

if __name__=='__main__':
    image_list=[]#储存图片URL的列表
    max_pages = 10
    start_url='http://jandan.net/ooxx'
    next_pages_url=start_url
    file_path='E:\\'
    for _ in range(max_pages):
        '''得到所有的图片的url,并添加进image_list'''
        next_pages_url,img_hash,flag=get_info(next_pages_url)
        for hash in img_hash:
            image_list.append(base64_decode1(hash))
        if flag == 1:
            break#没有下一页



    sum_image=len(image_list)
    print('总共有'+str(sum_image)+'张图片')

    index=0
    for image in image_list:
        '''下载图片'''
        try:
            image_url = 'http:'+image.decode()
        except:
            print('错误链接')
            continue
        filename = image_url.split('/')[-1]

        r = requests.get(image_url)
        with open(file_path+filename, 'wb') as f:
            f.write(r.content)
        index+=1
        print('\r下载进度'+str(int(index*100/sum_image))+'%',end='')

猜你喜欢

转载自blog.csdn.net/m0_37959925/article/details/80563817

python爬虫煎蛋网妹子图2（代码）

python爬虫煎蛋网妹子图动态爬虫1

Python Scrapy 煎蛋网妹子图实例

python爬虫.4.下载煎蛋网妹子图

python 爬虫爬取煎蛋网妹子图

爬虫之煎蛋网妹子图大爬哦

python爬取煎蛋网妹子图，已解密图片~~~~~

Python的学习笔记DAY8---爬虫练习之煎蛋网妹子图爬虫

python3通过selenium对煎蛋网妹子图的简单爬取

Python3 破解煎蛋网妹子图的加密函数，获取图片

Python爬虫(6):煎蛋网全站妹子图爬虫

Python爬虫煎蛋网全站妹子图爬虫

python爬虫入门-煎蛋网妹子图片下载 python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索

爬取煎蛋网妹子图

煎蛋网妹子图爬取

python 爬取煎蛋ooxx妹子图

Python爬取煎蛋妹子图

Python 爬取煎蛋妹子图

[Python 爬虫]煎蛋网 OOXX 妹子图爬虫（1）——解密图片地址

python3爬虫爬取煎蛋网妹纸图片

Python爬虫入门教程，突破煎蛋网反爬措施，妹子图批量抓取！

用Selenium+PhantomJS来抓取煎蛋网妹子图

python3 爬煎蛋ooxx妹子图

python爬虫-爬妹子图

Python 爬虫（清纯）妹子图爬取（代码自由奔放）

Python爬虫入门【2】：妹子图网站爬取

python3爬虫爬取煎蛋网妹纸图片（下篇）2018.6.25有效

Python教程：老师傅带你爬取全网妹子图！

简单应用Selenium+PhantomJS来抓取煎蛋网妹子图

[python爬虫]爬取妹子图

今日推荐

【学术精选】遥感领域高水平期刊：J-STARS 期刊介绍

探索二次元新境界：Han1meViewer——您的专属动漫神器

Java毕业设计：基于Java福建省地方特产销售商城系统毕业设计源代码作品和开题报告

【机器学习】自动驾驶——智能交通与无人驾驶技术的未来

智谱清影的魅力：使用CogVideoX-2b生成6秒视频的真实体验！

苹果可能将于 2025 年推出首款智能显示器和配套操作系统 homeOS

源码解析：从零解读SAM(Segment Anything Model)大模型！

《王者荣耀》鸿蒙原生版开启限量删档测试

fl studio v20.8中文破解版(附Crack文件+图文安装教程)

AI驱动TDSQL-C Serverless 数据库技术实战营-电商可视分析

828华为云征文 | 将Vue项目部署到Flexus云服务器X实例并实现公网访问

Java毕业设计：Java江西南昌城市文化展示网站系统毕业设计源代码作品和开题报告

周排行

单向链表的运用---一元多项式的加减详解

WEEK13 GITHUB

C语言左移和右移

四个概念详细分析servlet、filter、listener、interceptor的区别与联系

C语言如何使用print语句 %d%c%s

11.代码测试、维护

LAMMPS安装-给新手的建议

Android在页面上写字,居中写文字

OracleSID在本机上已经存在,请指定一个不同的SID的解决办法

开复老师的回信

每日归档

更多

2024-10-07(64)

2024-10-06(2)

2024-10-05(62)

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)