如何设计一个健壮而且厉害防爬策略 - 代码天地

如何设计一个健壮而且厉害防爬策略

其他 2018-05-14 15:26:30 阅读次数: 2

0.首先你得有一个能扛住爬虫的可以计算黑白名单的数据库，当然我们选择redis，单台 qps 达到20000+，杠杠的，然后你得在不影响业务的情况下来验证爬虫，我们可以通过异步读取nginx的access.log进行校验，前台只需要在关键的功能点判断一下ip是否在黑名单即可

1. 同一个ip在某个功能点一秒两次请求算爬虫，将ip加入黑名单，防住大部分的爬虫

2 .截取一段请求列表，如果某一个useragent出现的频率远远大于该正常该浏览器占有的比例，全部算爬虫,这里容易误杀，可以通过一个强壮的验证码来避免，一定要强壮，要不反而会方便爬虫！这个方法已经验证，特别厉害，特别是半夜没人的时候，杀的爬虫屁滚尿流

3.其他有针对性策略，通过user-agent referer，等特点，直接永久封禁ip

例如 user-agent 是python urllib，httpclient，等明显的爬虫的http库等，referer不符合页面跳转逻辑等

4.目前验证码已经很难防住现在的爬虫了，随便去买个第三方的服务，再复杂的验证码也能搞定，现在神经网络太厉害了，

目前的策略是通过手机来解锁被封禁的ip

5.针对2的，如果有的人随机换user-agent，那么就再来一条策略，如果半个小时内，同一个ip user-agent超过5种，永久封禁

猜你喜欢

转载自blog.csdn.net/qiushi888/article/details/79007623

如何设计一个健壮而且厉害防爬策略

如何设计一个优雅健壮的Android WebView？（下）

如何设计一个优雅健壮的Android WebView？（上）

如何设计一个优雅健壮的Android WebView？

webview之如何设计一个优雅健壮的Android WebView？（下）(转)

如何设计一个机器学习驱动的策略？

如何成为一个很厉害的工程师

《精进•如何成一个很厉害的人》

一个更加健壮的ThreadPool

开发一个健壮的npm包

《精通react/vue组件设计》之实现一个健壮的警告提示(Alert)组件

如何部署一个健壮的 apache-airflow 调度系统

python高级—— 从趟过的坑中聊聊爬虫、反爬、反反爬，附送一套高级爬虫试题打造一个健壮高效的网络爬虫

介绍一个厉害的工具

在一个页面嵌入另一个页面，而且还要调整比例大小如何做呢

打造一个健壮高效的网络爬虫

一个较为健壮的下单方案

读《精进如何成为一个很厉害的人》

卷积：如何成为一个很厉害的神经网络

【读书体会】《精进》：如何成为一个很厉害的人

读《精进-如何成为一个厉害的人》有感

读书笔记《精进——如何成为一个很厉害的人》

精进：如何成为一个很厉害的人--作者：采铜

我想配置一个很实用而且酷酷的vim

分享一个好用而且免费的GIF录制软件

每天一个设计模式之策略模式

设计一个完美的HTTP缓存策略

同一个局域网之内，如何远程控制对方的电脑而且不用对方同意

如何设计一个优秀的分布式系统？重要因素、工具、策略都在这里

如何查看一个linux用户的口令保留策略

今日推荐

周排行

rac环境打PSU补丁ERROR:This patch is not applicable to GI home.

科学活动《离园倒计时》（时间）

Windows 沙箱开发踩坑

secureCRT 改变显示宽度

hdu多校第六场1008 （hdu6641）TDL 暴力

【low向】注册用户时密码强度的判定

__int64

context-params与init-params

JS三个编码函数和net编码System.Web.HttpUtility.UrlEncode比较

springboot通过重写addResourceHandlers拦截请求访问本地资源

每日归档

更多

2024-08-08(0)

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)