使用 wget 下载备份一个 CSDN 账号下的博客文章

版权声明:知识共享-署名-相同方式共享(CC-BY-SA) https://blog.csdn.net/engrossment/article/details/84340746

永远要用风险意识,永远不要忘记备份。

自己发布到 CSDN 的博客,大多是没有其他副本的。以防未来的各种意外,值得定期把博客文章备份下来。针对这个问题花了点时间研究了下,于是有了以下解决方案。

Linux 下使用 wget 工具,未避免下载无关内容,指定 URL 匹配模式。示例如下:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent --accept-regex=https://blog.csdn.net/engrossment/* https://blog.csdn.net/engrossment

这样,一小段时间后就执行完毕,在当前目录下生成一个 blog.csdn.net 的目录,里面就包含了这个账号的博客的全部内容。

不过有一个问题是,这些下载下来的博客文章页面,用浏览器打开之后,过一会儿之后就会跳转到 csdn 首页。解决办法是更改其检测跳转的代码。

进入 blog.csdn.net/engrossment/article/details,执行以下命令:

sed -i "s/onerror/disable-onerror/g" *

稍等一小段时间即可。这样,再重新打开页面就不会自动跳转了。

其实这种方法也可以拉取下载其他人的博客下来,以供离线慢慢研究。

廖杰良 - 2018-11-22

扫描二维码关注公众号,回复: 5090471 查看本文章

猜你喜欢

转载自blog.csdn.net/engrossment/article/details/84340746