python爬虫系列(3.6-css选择器) - 代码天地

python爬虫系列(3.6-css选择器)

其他 2018-11-10 03:03:58 阅读次数: 0

章节是继上一小节的知识点,只是本人把它拆分了,如果你对css比较熟悉的话,可以直接使用这一章节的选择器

一、关于select选择器的使用

1、直接获取元素节点

print(soup.select('a'))

2、根据类名查找,比如要查找class=sister的标签

print(soup.select('.sister'))

3、根据id查找

print(soup.select("#link1"))

4、多条件查找

print(soup.select("p #link1")) # 查找p标签且是带id="link1"

5、查找子节点

print(soup.select("head > title"))

6、通过属性查找

print(soup.select('a[href="xx"]'))

二、获取内容

注意使用select选择的节点返回的都是list

soup = BeautifulSoup(html_doc, 'lxml')

position = []

trs = soup.select('tr')

for tr in trs:

tds = tr.select('td')

post = {}

title = tds[0].select('a')[0].get_text()

type = tds[1].get_text()

num = tds[2].get_text()

city = tds[3].get_text()

public_time = tds[4].get_text()

post['title'] = title

post['type'] = type

post['num'] = num

post['city'] = city

post['public_time'] = public_time

position.append(post)

print(position)

猜你喜欢

转载自blog.csdn.net/qq_40925239/article/details/83902559

python爬虫系列(3.6-css选择器)

python爬虫系列11--CSS选择器

python网络爬虫（CSS选择器）

python css选择器 -爬虫坑

Python爬虫CSS选择器

python爬虫(一)-------------------css选择器

CSS -- Python爬虫常用CSS选择器（Selectors）

Python爬虫包 BeautifulSoup 之 CSS 选择器

Python爬虫框架 scrapy之xpath选择器 css选择器

python css选择器

【爬虫入门1】css选择器

爬虫Beautiful Soup的CSS选择器

Python爬虫小白入门（十三）Python 爬虫 – 使用CSS选择器

Python爬虫之Selector选择器

python网络爬虫（XML选择器）

【爬虫】Python Scrapy Selectors (选择器)

爬虫——选择器

python | css选择器&xpath

python爬虫：scrapy框架xpath和css选择器语法

2.1-Python爬虫-正则/XML/XPath/CSS选择器-案例演示

python3爬虫(7)--使用pyquery的CSS选择器（Selectors）解析数据

Python爬虫学习笔记(摘记：http请求方法，CSS选择器)

python爬虫中的数据分析------css选择器详解

【CSS系列】第二章 · CSS选择器

Python爬虫之Scrapy框架系列（10）——Scrapy选择器selector

css的选择器

CSS——选择器

css选择器

CSS 选择器

CSS（选择器）

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)