版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/quuqu/article/details/52965691
为什么要反向代理处理图片资源呢?因为在做网站采集的时候,有时候我们并不想吧网站的图片全部下载下来,而是希望可以引用它原本网站上的图片,这样可以我们既可以拿到资源,又可以节约我们的磁盘空间,不过坏处就是被抓取的网站如果挂了,图片无法访问,那同样我们的服务器去访问也就失败了!
1.nginx 反向代理配置server里面的一个路径pic
location /pic/ {
set $hostx "";
set $addrs "";
if ( $uri ~ "^/pic/http./+([^/]+)/(.+)$") {
set $hostx $1;
set $addrs $2;
}
#resolver 127.0.0.1;
#proxy_pass http://$hostx/$addrs;
#proxy_set_header referer "http://$hostx";
rewrite ^(.*)$ http://$hostx/$addrs;
#http://mmbiz.qpic.cn/$arg_url;
#proxy_pass http://mmbiz.qpic.cn/$arg_search;
}
本来是想用proxy来做的,试了下会发生一个死循环,还不知道为什么无法成功,网上资料也还没找到,要是有同学会的话,希望可以指教一二, 最后我只好用rewrite 来让它去跳转了.
对uri进行了一个处理,pic目录后面的应该跟上完整的图片的http路径,然后rewrite到hosts去。。
待解决 :
还是要用proxy_pass来处理,这样可以加referer,更完美
*10月31日更新*
解决了proxy_pass处理失败的问题,原因是resolver没有指定dns地址,用本地地址报错,所以换成电脑上的dns地址就OK了。不过在处理微信公众号还是下载不下来,我还没弄清楚具体原因。
php下载文件解决:
使用php来做一个下载生成,只需要两行代码即可完成:
<?php
header('Content-type: image/jpeg');
echo file_get_contents(isset($_GET["url"])?$_GET["url"]:'');
?>