Python-反爬篇 - 代码天地

Python-反爬篇

其他 2021-03-28 20:49:56 阅读次数: 0

使用fake_useragent随机构建UserAgent

from fake_useragent import UserAgent

ua = UserAgent(verify_ssl=False)
def get_header():
    return {
    
    
        'User-Agent': ua.random
    }

使用代理池

import requests

#  首先需要配置代理池，具体见：https://github.com/Python3WebSpider/PorxyPool

def get_proxy():
    proxypool_url = 'http://127.0.0.1:5555/random'
    proxies = {
    
    'http': 'http://' + requests.get(proxypool_url).text.strip()}
    return proxies

使用time.sleep()

import time

# 以上方法加上适当的sleep，基本不会出错

time.sleep(0.1)  # 以s为单位

实践

import requests

url = 'https://m.weibo.cn/'
time.sleep(0.1)
resp = requests.get(url,headers=get_header(),proxies=get_proxy())

问题

批量爬取微博信息的时候还是会出现418错误，目前的措施只能相对减少418的产生。

猜你喜欢

转载自blog.csdn.net/MaoziYa/article/details/106658607

Python-反爬篇

Python-爬虫代理--proxy（反爬）

python-反爬虫

Python-爬爬爬虫

练习python反爬

Python爬虫自学之第（①）篇——爬虫伪装和反“反爬”

签名验证反爬，反反爬第二篇博客，Python爬虫120例

python-爬猫眼电影

python-（scrapy下）如何反爬虫

python爬虫--爬虫与反爬

Python爬虫之路-反爬与反反爬

Python爬虫入门教程 63-100 Python字体反爬之一，没办法，这个必须写，反爬第3篇

Python爬虫入门教程 62-100 30岁了，想找点文献提高自己，还被反爬了，Python搞起，反爬第2篇

python-爬取淘宝商品

python爬虫——爬虫伪装和反“反爬”

解决简单的反爬问题（使用python）

python反爬之懒加载

python反爬之用户代理

python爬虫与反爬、加密算法

Python爬虫---猫眼字体反爬

Python 体赛websocket反爬破解

python爬虫--cookie反爬处理

python爬虫之字体反爬

python爬虫js反爬案例

python爬虫采集反爬策略

【python】——爬虫05 初级反爬笔记

python爬虫字体反爬实习僧

Python爬虫｜反爬初体验

Python爬虫编程11——JS反爬

Python爬虫编程12——字体反爬

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)