【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意） - 代码天地

【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）

其他 2019-02-24 14:30:19 阅读次数: 0

第二种方式：参考链接：https://www.jianshu.com/p/6f7cf38d5792

pycharm调试scrapy常用的命令配置：

scrapy crawl <scrapy_name> （scrapy_name不是文件名，而是Spider的属性name的值）

scrapy runspider scrapy_first/spider/book.py

第一种模式（常用模式）.使用scrapy.cmdline的execute方法

首先，在项目文件scrapy.cfg的同级建立main.py文件（注意，必须是同级建立），在其中键入如下代码：
在其余爬虫文件中设置断点后，运行main.py,即可实现在pycharm中的调试。

from scrapy.cmdline import execute
import sys
import os

sys.path.append(os.path.dirname(os.path.abspath(__file__)))

单文件调试模式一：runspider+需要执行的spider的name.py文件
execute(['scrapy', 'runspider', 'scrapy_first/spiders/book.py'])

单文件调试模式二：crawl+需要执行的spider_name！！
这里的spider_name不是文件名,而是继承scrapy.spiders.Spider子类的name属性名字(必须是唯一的)
# execute(['scrapy', 'crawl', "spider_name"])
execute(['scrapy', 'crawl', 'test'])

class Test1Spider(Spider):

    name属性就是spider_name,【scrapy crawl spider_name】执行的文件名(必须是唯一)
    name = 'test'
 
    def parse(self, response):
        pass

猜你喜欢

转载自blog.csdn.net/weixin_43343144/article/details/87886148

【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）

【重磅推荐】python爬虫框架Scrapy的项目初始化和爬虫模块初始化的注意事项（务必跟着这个套路来，否则乱七八糟的问题都会出来！）

Pycharm中对scrapy爬虫工程开启调试模式（亲测有效）

关于scrapy分布式爬虫请求去重和指纹过期的两种方法——思路

在PyCharm环境中使用Jupyter Notebook的两种方法

JSP中include的两种方法

python 爬虫框架 scrapy两种运行方法

MFC串口通信的两种方法及注意事项

python爬虫模拟浏览器的两种方法

python爬虫使用Cookie的两种方法

Python破解反爬虫的两种方法

Python爬虫获取随机的UserAgent的两种方法

python面向对象中对私有方法的操作--》两种方法

pycharm 运行调试scrapy爬虫项目

python取出字典中的所有值的两种方法

JS中如何在外部引用私有变量的两种方法复习

Python中通过csv的writerow输出的内容有多余的空行两种方法

调试scrapy爬虫程序的方法

Eclipse插件的安装有两种方法

运行 Shell 脚本有两种方法：

nginx 让users有权限启动的两种方法

Python实现“有效的括号”的两种方法

Redis查找所有key的两种方法

api暴露的接口有两种方法

linux永久添加静态路由有两种方法

java中list中移除元素的两种方法。

python 爬虫scrapy的两种写法

排序的两种方法

延时的两种方法

建树的两种方法

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)