正则表达式简介及元字符

1、动机:

1. 普通字符
a 每个字符匹配对应的字符

2. 或
| 匹配 | 两边任意一个正则表达式

3. 匹配单个字符
. 匹配除换行外的任意字符

4. 匹配开始位置
^ 匹配目标字符串的开头位置

5. 匹配结束位置
$ 匹配字符串的结束位置

6. 匹配重复
* 匹配前面的字符出现0次或多次

7. 匹配重复
+ 匹配前面的字符出现1次或多次

8. 匹配重复
？匹配前面的字符出现0次或1次

9. 匹配重复
{n} 匹配指定的重复次数

10. 匹配重复
{m,n} 匹配前面的正则表达式 m–n次

11. 匹配字符集合
[字符集] 匹配任意一个字符集中的字符

12. 匹配字符集
[^…] 字符集取非，除列出的字符之外任意一个字符

13. 匹配任意（非）数字字符
\d 匹配任意数字字符 [0-9]
\D 匹配任意非数字字符 [^0-9]

14. 匹配任意（非）普通字符
\w 匹配普通字符 [_0-9a-zA-Z] 也能匹配普通汉字
\W 匹配非普通字符

15. 匹配任意（非）空字符
\s 匹配任意空字符 [ \r\t\n\v\f]
\S 匹配任意非空字符

16. 匹配字符串位置
\A 匹配字符串开头位置 ^
\Z 匹配字符串结尾位置 $
绝对匹配：正则表达式要完全匹配目标字符串内容
在正则表达式开始和结束位置加上^ $ (或者\A \Z)。这样正则表达式必须匹配整个目标字符串才会有结果

17. 匹配（非）单词边界
\b 匹配单词边界位置
普通字符和非普通字符交界认为是单词边界
\B 匹配非单词边界位置

元字符总结

匹配单个字符
a . \d \D \w \W
\s \S […] [^…]

匹配重复
*+ ? {n} {m,n}
匹配位置
^ $ \A \Z \b \B
其他
| () \