版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_36411874/article/details/84106359
#正则表达式,描述字符串排列的一套规则 原子,是正则表达式中最基本的组成单位。 (1)普通字符作为原子(“yue”有三个原子,y u e) (2)非打印字符作为原子 (3)通用字符作为原子 (4)原子表
#(1)p普通字符作为原子
import re
pattern="yue"
string="http://yue.cn.com"
resultl=re.search(pattern,string)
print(resultl)
#(2)非打印字符
如果多个换行,不适用,原因是\n用于一个换行符,\t用于匹配一个制表符,如果为空,则为None
pattern2="\n"
string2='''http://dsfasdf
fadsfsdf'''
result2=re.search(pattern2,string2)
print(result2)
#(3)通用字符作为原子,匹配python前边的任意一个字母,数据子或者下划线以及任意十进制的数,后边任意字母数字和下划线
pattern3="\w\dpythohn\w"
string3="adsd325pythohn_fsdfg"
result3=re.search(pattern3,string3)
print(result3)
为了方便我们写简洁的正则表达式,它本身还提供下面这样的写法
正则表达式 | 代表的匹配字符 |
---|---|
[0-9] | 0123456789任意之一 |
[a-z] | 小写字母任意之一 |
[A-Z] | 大写字母任意之一 |
\d | 等同于[0-9] |
\D | 等同于[^0-9]匹配非数字 |
\w | 等同于[a-z0-9A-Z_]匹配大小写字母、数字和下划线 |
\W | 等同于[^a-z0-9A-Z_]等同于上一条取非 |
#(4)原子表,[xyz]表示xyz也可以匹配到,单个,即是pythonx(pythony)pythonz
pattern4="\w\dpython[xyz]\w"
string4="adsd325pythonyz_fsdfg"
result4=re.search(pattern4,string4)
print(result4)