(1).scrapy介绍 - 代码天地

(1).scrapy介绍

其他 2018-07-02 20:54:33 阅读次数: 0

scrapy startproject xxx

cd xxx

scrapy genspider xxxx xxxx.com

# -*- coding: utf-8 -*-
import scrapy


class ShiinaSpider(scrapy.Spider):
    name = 'shiina'
    allowed_domains = ['mashiro.com']
    start_urls = ['https://tieba.baidu.com/p/5290405550?red_tag=0653675634']

    def parse(self, response):
        # response：相应
        # 执行命令：scrapy crawl shiina --nolog,--log意思是不打印日志
        print(response)
        print(response.url)
        print(response.text)  # 这里不显示了
    # 程序运行结果
    '''
    <200 https://tieba.baidu.com/p/5290405550?red_tag=0653675634>
    https://tieba.baidu.com/p/5290405550?red_tag=0653675634

    '''

　　

每一个创建的spider都会具有一个起始url，当我们执行的时候scrapy engine会将连接放在scheduler里面，然后往里面取链接，交给downloader去下载，下载完了交给spider。spider对内容进行解析，然后既可以将内容交给pipline进行持久化，也可以将新的url继续通过scrapy engine交给scheduler，然后继续递归爬取。

可以把scrapy engine看成一个while循环，scheduler看成是一个队列，scrapy engine不断地从队列里面取url，交给下载器去下载

猜你喜欢

转载自www.cnblogs.com/traditional/p/9255610.html

(1).scrapy介绍

Scrapy学习笔记(1) --Scrapy的介绍

python爬虫框架——scrapy（1）scrapy爬虫框架介绍

爬虫利器Scrapy框架：1:概要介绍

scrapy :介绍

python爬虫随笔-scrapy框架(1)——scrapy框架的安装和结构介绍

scrapy爬虫框架 (1. Scrapy的基本介绍、使用流程、分组打印、pipelines（管道）使用）

scrapy篇(1)scrapy入门

scrapy框架介绍及安装

scrapy 命令介绍

Scrapy-爬虫介绍

scrapy框架的介绍

scrapy初介绍

Scrapy框架介绍

scrapy -->CrawlSpider 介绍

Scrapy 框架介绍

爬虫介绍及Scrapy简介

scrapy爬虫框架介绍

scrapy--介绍

scrapy爬虫介绍

scrapy介绍及使用

Scrapy 框架介绍及入门

Scrapy 架构介绍

爬虫scrapy框架介绍

【爬虫框架】Scrapy介绍

Scrapy:安装介绍

Scrapy框架学习（一）Scrapy框架介绍

scrapy专利爬虫（一）——scrapy简单介绍

windows下安装Scrapy及scrapy模块介绍

[scrapy] pycharm开发scrapy - scrapy项目目录介绍

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)