起始URL为:
https://news.cnblogs.com/
文章列表页的url格式固定,通过修改url获取不同分页的数据是常用的方法,但当分页数变化时,需要修改配置。
最终爬取策略:
获取每个分页“下一页”的链接。