scrapy 设置提前终止爬虫

Scrapy的 CloseSpider 扩展会在满足条件时自动终止爬虫程序。可以设置 CLOSESPIDER_TIMEOUT (秒)、 CLOSESPIDER_ITEMCOUNT CLOSESPIDER_PAGECOUNT CLOSESPIDER_ERRORCOUNT 分别代表在指定时间过后、在抓取了指定数目的 Item 之后、在收到了指定数目的响应之后、在发生了指定数目的错误之后就终止爬虫程序

猜你喜欢

转载自blog.csdn.net/cand6oy/article/details/80284044