字符串操作方法有:
s = 'hello word'
s.find('l') 查询第一个l的索引
s.replace('ll','xx') 替换
s.split('w') 以w进行分割
这些都是完全匹配,要进入模糊匹配就需要引进正则表达式
正则表达式,主要作为字符串模糊匹配的作用
正则 元字符
. 点 ret = re.findall('w.r','hello world') . 点除了换行符以外,可以代指任何字符,一个点代表一个字符,点叫做通配符
尖角符^ ret = re.findall('^w.r','hello world') 从字符串的开头开始匹配,只从字符串开头开始匹配
$ 符 ret = re.findall('w.r$','hello world') 只在字符串最后位置进行匹配,
* 重复匹配 ret = re.findall('wr*'hello world') 重复匹配 优先匹配*前第一个字符
+重复匹配 ret = re.findall('ab+','hello b word') 重复匹配,至少要一个b
? 重复匹配 ret = re.findall('a?b','aaaaaabsdsdabsdfsb') 重复0-1次a
{}重复匹配 ret = re.findeall('a{5}b','aaaaab') 重复匹配指定次数a,ret = re.findeall('a{1,3}b','aaasdasdn') 指定按区间匹配
[] 字符集 ret = re.findall('[a,b]','asdbasd'] 匹配a,或者b都可以。或的关系
[] 字符集 ret = re.findall('[a,*]),'as*') 取消元子符的特殊作用,这里*已经不是元子符了,就是作为*这个字符。这三个字符例外(\ ^ -)
ret = re.findall('[1-9]','asd1231') 1-9的意思
ret = re.findall([^t],'tasdasd') 取反,除t以外的所有字符ret = re.findall([^t,a],'asd') t,a 是一组,这里去除去t 和a 以外的其他字符
\ 正则里最重要的一个:
反斜杠后面跟元子符取出特殊功能
反斜杠后面跟元字符实现特殊功能
\d 匹配任何十进制数 等价于[0-9]
\D 匹配任何非十进制数字符 等价于[^0-9]