Python---cssselector选择器

其他 2018-06-25 05:13:27 阅读次数: 2

 
   # cssselector：和xpath是使用比较多的两种数据提取方式。 
  
   # scrapy爬虫框架：支持xpath/css 
  
   # pyspider爬虫框架：支持PyQuery，也是通过css样式选择器实现的 
  
   # pip install cssselector 
  
   import cssselect 
  
   from lxml.html 
   import etree 
  
    html = 
   """ 
  
    <div id='content'> 
  
    <ul class='list'> 
  
    <li class='one'>哈哈</li> 
  
    <li class='two'>Two</li> 
  
    <li class='three'>Three</li> 
  
    <li class='four four1 four2 four3'>Four</li> 
  
    <div id='inner'> 
  
    <a href='http://www.baidu.com'>百度一下</a> 
  
    <p>第一段</p> 
  
    <p>第2段</p> 
  
    <p>第3段</p> 
  
    <p> 
  
    第4段 
  
    <span id="first">法大师傅大师傅</span> 
  
    </p> 
  
    <p>第5段</p> 
  
    <p>第6段</p> 
  
    </div> 
  
    </ul> 
  
    </div> 
  
   """ 
  
    html_obj = etree.HTML(html) 
  
    span = html_obj.cssselect( 
   '.list > .four')[ 
   0] 
  
   print(span.text) 
   # 获取文本内容 
  
   # print(help(span)) 
  
   # print(span.attrib['id']) # 获取属性：是一个字典 
  
   # csv:

猜你喜欢

转载自blog.csdn.net/qq_42336542/article/details/80697856

Python---cssselector选择器

Python爬虫数据提取方式——cssselector样式选择器

CSS选择器——cssSelector定位方式详解

python css选择器

python 之前端开发（基本选择器、组合选择器、交集与并集选择器、序列选择器、属性选择器、伪类选择器、伪元素选择器）

Python爬虫之Selector选择器

python网络爬虫（XML选择器）

python网络爬虫（CSS选择器）

【爬虫】Python Scrapy Selectors (选择器)

python 图片长宽选择器

python css选择器 -爬虫坑

python学习之 beautifulsoup选择器

python爬虫(一)-------------------css选择器

Python爬虫CSS选择器

python Beautifulsoup用法 (标签选择器)

Python中xpath选择器的学习

python | css选择器&xpath

Python爬虫框架 scrapy之xpath选择器 css选择器

CssSelector

css选择器

ID选择器

CSS——选择器

选择器指南

时间选择器

jQuery选择器

CSS 选择器

ios 选择器

AngularJS 选择器

类选择器

css的选择器

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)