Python3.6下安装Scrapy框架及其基本使用 - 代码天地

Python3.6下安装Scrapy框架及其基本使用

其他 2019-03-18 00:36:06 阅读次数: 0

1 利用anaconda安装scrapy框架

conda install scrapy

在这里插入图片描述
会出现很多的依赖包要求更新和下载，输入y:

等待下载即可
输出scrapy命令，出现如下表示安装成功

2 Scrapy基本使用

创建Scrapy项目

首先进入你要进入你要创建爬虫项目的目录的文件夹，然后执行命令：

scrapy startproject myspiders（项目名）

在这里插入图片描述
创建好的项目目录如下：

文件说明：
scrapy.cfg ：项目的配置信息，主要为Scrapy命令行工具提供一个基础的配置信息。（真正爬虫相关的配置信息在settings.py文件中）
items.py: 设置数据存储模板，用于结构化数据，如：Django的Model
pipelines: 数据处理行为，如：一般结构化的数据持久化
settings.py: 配置文件，如：递归的层数、并发数，延迟下载等
spiders: 爬虫目录，如：创建文件，编写爬虫规则
创建爬虫文件
进入爬虫目录文件夹

cd  myspiders\spiders

再生成爬虫文件

scrapy genspider Baidu baidu.com

爬虫名为Baidu
在这里插入图片描述
在Pycharm中显示如下：

检查爬虫
当再次使用scrapy命令时，会出现新的命令，如下：

检查爬虫：

scrapy check  Baidu

在这里插入图片描述
例如，爬出页面相应体，修改Baidu.py文件

运行爬虫

scrapy crawl Baidu

结果如下：
在这里插入图片描述
相关实例更新中。。。。。。。。

参考

[1] https://blog.csdn.net/qq_42543250/article/details/81347368
[2] http://www.cnblogs.com/kongzhagen/p/6549053.html
[3] https://www.cnblogs.com/jiangzijiang/p/8459669.html
[4] https://blog.csdn.net/qijingpei/article/details/70194251

猜你喜欢

转载自blog.csdn.net/weixin_41104835/article/details/88319765

Python3.6下安装Scrapy框架及其基本使用

Python3.6下scrapy框架的安装

python3.6下安装scrapy Python3.6下scrapy框架的安装

Python3.6下scrapy框架的安装 (转)

迪士尼源码-下载Python3.6下scrapy框架的安装

Windows中python3.6下scrapy框架的安装

Python3.6安装Scrapy爬虫框架

Python3.6下安装Scrapy

Scrapy安装（python3.6）

python3.6安装Scrapy

杏彩源码出售与Python3.6下scrapy框架的安装

Python3.6中爬虫框架Scrapy的下载与安装

Windows10下安装Scrapy（Python3.6）

爬虫：Python3.6 + Scrapy 框架的案例

windows下python3.6安装pycryto or crypto or pycryptodome与使用

Python3.6 在centos7下使用rpm安装

python3.6下如何安装Scrapy 模块(error: Microsoft Visual C++ 14.0 is required. )

python3.6在win64下安装scrapy出现error

windows python3.6下安装scrapy的几点注意事项

python3.6 Scrapy框架下的爬虫（一）

linux下安装python3.6

Centos下安装Python3.6

Python3.6 下安装MySql

Linux系统下安装python3.6

windows下安装python3.6

windows 下 python3.6 安装 xgboost

ubuntu下python3.6的安装及配置

在centos下安装Python3.6

CentOS 7下安装Python3.6

Windows下python3.6 安装MySQLdb

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)