python正则表达式提取/过滤字符串中的数字

其他 2021-03-19 05:10:44 阅读次数: 0

文章目录

背景
思路
code

背景

训练文本分类模型需要对文本中的数字、特殊符号预处理

思路

1 既然是提取数字，那么数字的形式一般是：整数，小数，整数加小数；

2 所以一般是形如：----.-----；

3 根据上述正则表达式的含义，可写出如下的表达式："\d+.?\d*"；

4 \d+匹配1次或者多次数字，注意这里不要写成*，因为即便是小数，小数点之前也得有一个数字；.?这个是匹配小数点的，可能有，也可能没有；\d*这个是匹配小数点之后的数字的，所以是0个或者多个

code

# -*- coding: cp936 -*-
import re
 
string="A1.45，b5，6.45，8.82"
print(re.findall(r"\d+\.?\d*",string))  # 查找
# ['1.45', '5', '6.45', '8.82']
res = re.sub(r"\d+\.?\d*", "", string)  # 过滤

其他类似：
如过滤中英文标点和特殊符号
过滤换行符等特俗符号

# 替换 空格 \t \r \n
import re
 
str1='123  456  7\t8\r9\n10'
str1 = re.sub('[\s+]', '', str1)
print(str1)

猜你喜欢

转载自blog.csdn.net/m0_38024592/article/details/113667274

python正则表达式提取/过滤字符串中的数字

Python:利用正则表达式从字符串提取数字

python 从字符串中提取数字，使用正则表达式

oracle利用正则表达式提取字符串中的数字

正则表达式-字符串提取数字表达式

JS 提取字符串中的数字正则表达式去除非数字字符

python正则表达式03--字符串中匹配数字

python 正则表达式找出字符串中的纯数字

正则表达式匹配字符串中的数字 Python

python使用正则表达式删除字符串中的数字

Java通过正则表达式提取数字串或者字符串

php 正则表达式字符串中提取带小数点的数字

Java编程中使用正则表达式过滤非数字字符串

Java正则表达式系列--从字符串中提取字符串或数字

用python正则表达式提取字符串

Python中提取指定字符串取出中间文本正则表达式

python如何用正则表达式提取字符串

Qt技巧：正则表达式提取字符串中的键值对数据

pandas中DataFrame字符串过滤之正则表达式

python正则表达式翻转字符串

python 正则表达式与字符串匹配

PHP中字符串与正则表达式

正则表达式：匹配字符串中的';'

字符串（4）：正则表达式（中）

C#从字符串中提取所有的数字并获得数字个数（正则表达式）

架构师之正则表达式(四)---------------从字符串中提取一串数字.

字符串中找出连续最长的数字串（正则表达式）

使用正则表达式来获取String字符串中的文字与数字

JavaScript 正则表达式：字符串中查找数字

【java后端】java通过正则表达式去掉字符串中数字

今日推荐

【学术精选】遥感领域高水平期刊：J-STARS 期刊介绍

探索二次元新境界：Han1meViewer——您的专属动漫神器

Java毕业设计：基于Java福建省地方特产销售商城系统毕业设计源代码作品和开题报告

【机器学习】自动驾驶——智能交通与无人驾驶技术的未来

智谱清影的魅力：使用CogVideoX-2b生成6秒视频的真实体验！

苹果可能将于 2025 年推出首款智能显示器和配套操作系统 homeOS

源码解析：从零解读SAM(Segment Anything Model)大模型！

《王者荣耀》鸿蒙原生版开启限量删档测试

fl studio v20.8中文破解版(附Crack文件+图文安装教程)

AI驱动TDSQL-C Serverless 数据库技术实战营-电商可视分析

828华为云征文 | 将Vue项目部署到Flexus云服务器X实例并实现公网访问

Java毕业设计：Java江西南昌城市文化展示网站系统毕业设计源代码作品和开题报告

周排行

单向链表的运用---一元多项式的加减详解

WEEK13 GITHUB

C语言左移和右移

四个概念详细分析servlet、filter、listener、interceptor的区别与联系

C语言如何使用print语句 %d%c%s

11.代码测试、维护

LAMMPS安装-给新手的建议

Android在页面上写字,居中写文字

OracleSID在本机上已经存在,请指定一个不同的SID的解决办法

开复老师的回信

每日归档

更多

2024-10-07(64)

2024-10-06(2)

2024-10-05(62)

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)