re.sub功能是对于一个输入的字符串,利用正则表达式,来实现字符串替换处理的功能返回处理后的字符串
re.sub共有五个参数
三个必选参数 pattern,repl,string
两个可选参数count,flags
- pattern,表示正则中的模式字符串
- 反斜杠加数字(\n)表示对应匹配的组也就是用之前匹配到的字符串补充到这个位置,例如
- 将“hello python,ni hao c,zai jian python”替换为PHP,代码如下替换成功
import re
inputStr="hello python,ni hao c,zai jian python"
replaceStr=re.sub(r"hello (\w+),ni hao (\w+),zai jian python","PHP",inputStr)
print (replaceStr)
输出:
PHP
2.去除字符串中的中文字符
import re
inputStr="hello python,ni hao c,zai jian python 中国"
replaceStr=re.sub(r"[\u4e00-\u9fff]+","",inputStr)
print (replaceStr)
输出:
hello python,ni hao c,zai jian python
flags,匹配模式,可以使用按位或‘|‘表示同时生效,也可以在正则表达式中指定。
- re.I忽略大小写
- re.L表示特殊字符集\w,\W,\b,\B,\s,\S
- re.M表示多行模式
- re.S ‘.’包括换行符在内的任意字符
- re.U表示特殊字符集\w,\W,\b,\B,\d,\D,\s,\D