Python之数据采集(No.2) - 代码天地

Python之数据采集(No.2)

其他 2019-05-12 10:01:13 阅读次数: 0

正则表达式常用符号

“*"匹配前面的字符，子表达式或者括号里的字符0次或者多次
”+“匹配前面的字符，表达式或者括号里的字符至少1次
”[]“匹配任意一个字符
”()“表达式编组，表达式里编组的优先进行运算
”{m,n}"匹配前面的字符，子表达式或括号里的字符m到n次（包含m或n）
[^]匹配任意一个不在中括号里的字符
“|”匹配任意一个由竖线分割的字符，子表达式
“.“匹配任意单个字符
”^“指字符串开始位置的字符或者子表达式
”\“转义字符
”$“从末尾开始匹配

例子：

from urllib.request import urlopen
from bs4 import BeautifulSoup
import re   //引入正则表达式
html=urlopen("http://www.pythonscraping.com/pages/page3.html")
bsObj=BeautifulSoup(html)      
images=bsObj.findAll("img",{"src":re.compile("\.\.\/img\/gifts\/img.*\.jpg")})   ///转义字符
for image in images:
    print(image["src"])

Lambda表达式

soup.findAll(lambda tag:len(tag.attrs)==2)
<div class="body" id="content"></div>
<span style="color:red" class="title"></span>

猜你喜欢

转载自blog.csdn.net/weixin_42578658/article/details/90045017

Python之数据采集(No.2)

Python日记(NO.2)

Python图书之《Python网络数据采集》

python数据采集2-HTML解析

《python网络数据采集》笔记2

Python之数据采集(No.1)

python学习之爬虫网络数据采集

python3+Pytest 接口自动化测试全方案设计与开发-No.2接口自动化框架编写-7-数据驱动之yaml数据驱动

python3+Pytest 接口自动化测试全方案设计与开发-No.2接口自动化框架编写-8-数据驱动之excel数据驱动

python opencv入门（学习笔记no.2）-视频的读入读出

NO.2 Python读入图片并灰度显示并保存退出

leetcode No.2 两数相加 (python3实现)

[NumPy 学习笔记] - No.2 NumPy数据索引

力扣——数据库刷题 No.2

Python网络数据采集（2）——复杂HTML解析（2）

2018.8.25 No.2

小记 no.2

论文分享NO.2

组合（递归no.2）

Java学习NO.2

No.2 Linux基础

No.2 JSX 简介

NO.2随笔

选择结构（no.2）

Oracle(No.2)

Linux(No.2)

机器学习No.2

约瑟夫问题No.2

【TouchDesigner笔记】NO.2

【Arduino笔记】NO.2

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)