python3 + Scrapy爬虫学习之scrapy安装 - 代码天地

python3 + Scrapy爬虫学习之scrapy安装

其他 2019-04-10 21:31:06 阅读次数: 0

scrapy是功能强大的爬虫库，属于爬虫工程师必备技能，这篇博客记录scrapy在windows下的安装及安装遇见的各种bug

scrapy依赖于lxml 和Twisted，以及pypiwin32，没有pypiwin32在运行爬虫时会报错（没试过）

上干货

1，安装lxml pip install lxml

2，pip install pypiwin32

3 ，根据python版本下载Twisted，下面是链接

https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

安装时要进入Twisted所在的路径，不然会报错

我的在E盘下的Scrapy里，python版本3.7安装方法如下

即可开始解压

关于pip install xxx 报错

一：有人说可能是pip未更新，因为过于旧的版本确实无法安装模块，更新方法

python -m pip install --upgrade pip

二：针对第一点，如果更新失败，推荐以下步骤

python -m pip uninstall pip 该命令可卸载安装的pip

然后到这里https://pypi.org/project/pip/#files下载最新版pip

你下到的是一个.tar.gz的压缩包，解压一次后再文件夹找到.tar的压缩包再次解压，进入第二个解压后的文件看见setup.py即可

进入cmd命令台，进入setup.py所在文件夹后，执行下面命令

python setup.py install

即可安装pip

三：关于pip install XXX 报错：Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'ConnectTimeoutError

这个报错可能会出现在你所有的pip install 的步骤中。

网上很多解决方法，看的眼花缭乱，这里给个最简单的，也是直接解决了我的问题

换源

例如安装lxml时报这个错误，就这样

pip insatll lxml -i http://mirrors.aliyun.com/pypi/simple/ 这个是阿里云

下面贴几个常用源

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

豆瓣(douban) http://pypi.douban.com/simple/

清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/

这种安装方法不仅可以解决这个问题，平时安装模块时速度更是快很多，谁用谁知道

最后，解决了以上问题，并安装以上模块后

pip install scrapy

安装了最重要的scrapy就可以准备我们的第一个scrapy爬虫了

猜你喜欢

转载自blog.csdn.net/s_kangkang_A/article/details/88956622

python3 + Scrapy爬虫学习之scrapy安装

python3爬虫之安装和使用scrapy

python3 + Scrapy爬虫学习之创建项目

Python爬虫之Scrapy的安装

python爬虫之Scrapy学习

Python3安装Scrapy

Python3 --- Scrapy安装

Python3之Scrapy学习（一）安装与了解scrapy目录

【Python3 爬虫学习笔记】Scrapy框架的使用 3

Python3 Scrapy爬虫框架(Scrapy/scrapy-redis)

Python3爬虫(1):安装Scrapy(转载)

python爬虫之scrapy框架的安装（详细）

python爬虫之scrapy框架安装

python3利用Scrapy实现爬虫--学习笔记

【Python3 爬虫学习笔记】Scrapy框架的使用 4

Python学习笔记——爬虫之Scrapy框架

python学习之Scrapy爬虫框架

python3 爬虫——scrapy文档

python爬虫之scrapy

python3 + Scrapy爬虫学习之腾讯实战爬取

转- Python3网络爬虫(五)：Python3安装Scrapy

Python3网络爬虫(五)：Python3安装Scrapy

【python3爬虫】Scrapy Win10下安装与新建Scrapy项目

python学习笔记之爬虫-3-初识scrapy

Windows下Python3安装Scrapy

CentOS安装python3及scrapy

python3 scrapy 安装记录

python3下安装scrapy库

Python3安装scrapy的玄学

python3 安装 scrapy 模块

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)