PyCharm+ENV+Scrapy

其他 2019-02-18 09:01:21 阅读次数: 0

记录使用 PyCharm 创建 Scrapy 项目过程。

使用 PyCharm 创建一个干净的 Python 工程

使用 env 环境

Screen Shot 2019-01-15 at 9.55.59 AM.png

安装 Scrapy

打开 PyCharm 设置，安装 Scrapy。

Screen Shot 2019-01-15 at 9.41.06 AM.png

创建 Scrapy 工程

打开 PyCharm 命令行工具

# 后退一步，减少目录层级
cd  ..

# [Demo2] 必须和工程文件名相同
scrapy startproject Demo2

cd Demo2

# 使用模版创建一个爬虫
scrapy genspider example example.com

配置运行

创建 start_scrapy.py

from scrapy import cmdline
cmdline.execute('scrapy crawl example'.split())

20190115102042.png

测试

修改 Demo2/spiders/example.py:

# -*- coding: utf-8 -*-
import scrapy

class ExampleSpider(scrapy.Spider):
    name = 'example'
    allowed_domains = ['baidu.com']
    start_urls = ['http://baidu.com/']

    def parse(self, response):
        print(response.body)

爬 baidu.com 还需要修改设置 settings.py ROBOTSTXT_OBEY = False

运行后：

20190115102211.png

其他问题

Forbidden by robots.txt

修改 settings.py:

# Obey robots.txt rules
ROBOTSTXT_OBEY = False

参考：https://www.jianshu.com/p/eda047ac5c89

猜你喜欢

转载自blog.csdn.net/weixin_33834628/article/details/87011506

PyCharm+ENV+Scrapy

2018 Scrapy Environment Enhance(3)Docker ENV

Pycharm 安装scrapy

PyCharm创建scrapy项目

PyCharm中Scrapy的安装

pycharm 下scrapy项目

Scrapy简介与pycharm的使用

Pycharm中的scrapy安装

Pycharm下安装scrapy

pycharm安装scrapy步骤

PyCharm安装scrapy框架

scrapy（一）--Pycharm创建scrapy项目

pycharm安装scrapy报错的解决

在pycharm中使用scrapy爬虫

pycharm中创建scrapy项目

使用pycharm运行调试scrapy

使用pycharm运行scrapy项目

pycharm:ModuleNotFoundError: No module named 'scrapy'

Pycharm中的scrapy安装教程

在PyCharm中运行scrapy项目

利用pyCharm创建scrapy项目

在PyCharm内部运行Scrapy项目

env

[scrapy] pycharm开发scrapy - scrapy项目目录介绍

pyCharm 如何使用anaconda 里配置好的env的环境

初识Scrapy框架（一）——在Pycharm上安装Scrapy

scrapy如何在pycharm中的使用

pycharm 运行调试scrapy爬虫项目

如何在pycharm中调试scrapy

PyCharm调试运行Scrapy教程

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)