1 scrapy框架
1.1 文件保存
- 利用
-o
将抓取的数据保存为 books.csv
# 运行并保存
scrapy crawl book_spider -o books.csv
1.2 页面解析
self
的含义:
在Python类中规定,函数的第一个参数是实例对象本身,并且约定俗成,把其名字写为self,参考:
https://blog.csdn.net/love666666shen/article/details/78189984- css、xpath命令
https://blog.csdn.net/mouday/article/details/80455560
1.3 单词
- extract() 提取
- yield 生成器