pycharm实现scrapy爬虫的生成和入门 - 代码天地

pycharm实现scrapy爬虫的生成和入门

其他 2020-08-04 01:56:52 阅读次数: 0

虽然是用pycharm进行调试，但是最开始一定不要在pycharm中生成项目，因为要用scrapy自己生成一个项目，否则会缺少如同scrapy.cfg的配置文件，导致Unknown command: crawl错误。
所以先在自己想要的地方开始：

scrapy startproject myproject

注意这个myproject是自定义的文件夹。然后在pycharm里找到这个项目。发现已经自动生成了这样的结构，也帮忙配置好了环境变量。
在这里插入图片描述
创建项目之后，我们还需要创建一个爬虫，官方的语法如下：

scrapy genspider [-t template] <name> <domain>

注意：name参数是爬虫名，不能与项目名相同，domain参数是想要爬取的网站。然后就能在spiders里面看到刚刚的生成的爬虫。
在这里插入图片描述
runspider命令可以直接通过运行 .py 文件来启动爬虫。此时要退到根目录下输入，注意不需要输入.py：

scrapy crawl <spider_file>

在这里插入图片描述
如果不想在命令行执行就可以在根目录下设置启动的脚本，我设置的名字叫做start.py,其中myspider可以替换成任意爬虫名字。

接下来是命令行的调试：

scrapy shell [url]

注意官方文档：https://scrapy-chs.readthedocs.io/zh_CN/0.24/topics/commands.html

猜你喜欢

转载自blog.csdn.net/qq_41337100/article/details/106456551

pycharm实现scrapy爬虫的生成和入门

在pycharm中使用scrapy爬虫

scrapy爬虫快速入门

爬虫(七)scrapy入门

Scrapy爬虫入门

爬虫进阶：Scrapy入门

爬虫——scrapy入门

Scrapy Python爬虫入门

Scrapy 爬虫入门

Scrapy爬虫入门基础

python爬虫scrapy入门

Scrapy爬虫快速入门

python 爬虫框架scrapy学习记录和整理 python爬虫框架scrapy入门文档学习

Scrapy爬虫入门教程一安装和基本使用

Scrapy爬虫入门Request和Response（请求和响应）

pycharm 运行调试scrapy爬虫项目

Pycharm中运行Scrapy爬虫程序

Scrapy爬虫框架入门

爬虫框架scrapy入门（一）

python爬虫入门（3）----- scrapy

Python爬虫框架scrapy的入门

Python爬虫之路-Scrapy入门

爬虫入门六（异步的爬虫框架scrapy）

python爬虫入门 ✦ 乞丐版scrapy_redis分布式 + 增量式爬虫的实现

Python爬虫实现 — Scrapy使用

Golang 的类Scrapy爬虫实现

通过scrapy实现简单爬虫

Scrapy爬虫的暂停和启动

【Python爬虫：Scrapy】之 PyCharm 搭建Scrapy环境+创建Scrapy项目实例

[爬虫入门]Python中使用scrapy框架实现图片爬取

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)