Scrapy 简单操作

其他 2018-06-02 11:12:23 阅读次数: 0

现在shell里面

scrapy startproject tutorial

然后

cd tutorial

scrapy genspider quotes quotes.toscrape.com

观察原始页面发现数据存储在3个内容里面

text

author

tags

然后修改Items.py

# -*- coding: utf-8 -*-

# Define here the models for your scraped items
#
# See documentation in:
# https://doc.scrapy.org/en/latest/topics/items.html

import scrapy


class QuoteItem(scrapy.Item): 
　　text= scrapy.Field() 
　　author=scrapy.Field() 
　　tags= scrapy.Field()

　　def parse(self, response):
  　　  quotes = response.css('.quote')
 　　   for quote in quotes:
  　　      text = quote.css('.text::text').extract_first()
 　　       author = quote.css('.author::text').extract_first()
 　　       tags = quote.css('.tags .tga::text').extract()

猜你喜欢

转载自www.cnblogs.com/zj0724/p/9124756.html

Scrapy 简单操作

scrapy专利爬虫（一）——scrapy简单介绍

scrapy 简单爬虫实验

scrapy的简单demo

scrapy简单爬虫（一）

scrapy简单实战

scrapy简单实践

py scrapy 简单命令

scrapy简单入门

一、Scrapy的简单使用

简单scrapy框架实例

scrapy框架简单了解

scrapy的简单使用

scrapy框架的简单使用

简单的scrapy实例

Scrapy爬虫简单实例

scrapy爬虫简单案例

Scrapy基本操作流程

Scrapy入门操作

scrapy操作流程

scrapy操作指南

scrapy基本操作

scrapy高级操作

scrapy ip 代理操作

Scrapy 安装及基础操作

scrapy专利爬虫（三）——简单实际操作

Scrapy入门：简单爬虫项目梳理整个框架操作流程

Scrapy简单入门及实例讲解

scrapy以及redis简单应用

scrapy爬虫框架简单实例

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)