正则表达式的基础认识

**次数符号**
```
* 0或多次
+ 1或多次
？0或1次
{n} 恰n次
{n,m} 从n到m次
```

**其他符号**

符号    等价形式
```
\d        [0-9]
\D      [^0-9]
\w         [a-zA-Z_0-9]
\W         [^a-zA-Z_0-9]
\s         [\t\n\r\f]
\S         [^\t\n\r\f]
.         任何字符
```

**边界匹配器**

行开头    ^
行结尾  $
单词边界 \b

**贪婪模式**:最大长度匹配非贪婪模式:匹配到结果就好,最短匹配。区别就是有没有加一个? 有就时非贪婪模式，也就是懒模式，懒得再继续匹配。

**环视**
```
字符                 描述                     匹配对象
.                    单个任意字符
[...]                 字符组                     列出的任意字符
[^...]                                         未列出的任意字符
^                     caret                     行的起始位置
$                     dollar                     行的结束位置
\<                                           单词的起始位置
\>                                             单词的结束位置
\b                   单词边界
\B                     非单词边界
(?=Expression)        顺序肯定环视            成功,如果右边能够匹配
(?!Expression)        顺序否定环视            成功,如果右边不能够匹配
(?<=Expression)        逆序肯定环视            成功,如果左边能够匹配
(?<!Expression)     逆序否定环视            成功,如果左边不能够匹配
```
举例:北京市(海淀区)(朝阳区)(西城区)

Regex: .*(?=\\()

**模式和匹配器的典型调用次序**

1. 把正则表达式编译到模式中
Pattern p = Pattern.compile("a*b");
2. 创建给定输入与此模式的匹配器
Matcher m = p.matcher("aaab");
3. 尝试将整个区域与此模式匹配
boolean b = m.matches();

例子及解析：

Java中用正则表达式截取字符串中第一个出现的英文左括号之前的字符串。比如：北京市（海淀区）（朝阳区）（西城区），截取结果为：北京市。正则表达式为（）

```
".*?(?=\\()"
```
```
".*?(?=\()"
```
```
".*(?=\\()"
```
".*(?=\()"

1.什么是正则表达式的贪婪与非贪婪匹配

如：String str="abcaxc";

Patter p="ab*c";

贪婪匹配:正则表达式一般趋向于最大长度匹配，也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str，结果就是匹配到：abcaxc(ab*c)。

非贪婪匹配：就是匹配到结果就好，就少的匹配字符。如上面使用模式p匹配字符串str，结果就是匹配到：abc(ab*c)。

2.编程中如何区分两种模式

默认是贪婪模式；在量词后面直接加上一个问号？就是非贪婪模式。

量词：{m,n}：m到n个

*：任意多个

+：一个到多个

？：0或一个

'.' 是一个元字符，匹配除了换行符以外的任意字符.

'*' 同样是元字符，不过它代表的不是字符，也不是位置，而是数量——它指定* 前边

的内容可以连续重复使用任意次以使整个表达式得到匹配.' .*' 连在一起就意味着任意数量的不包含换行的字符.

(?=exp) 也叫零宽度正预测先行断言，它断言自身出现的位置的后面能匹配表达式exp 。比如\b\w+(?=ing\b) ，

匹配以ing结尾的单词的前面部分(除了ing以外的部分) ，如查找 I'm singing while you're dancing. 时，它会

匹配 sing 和 danc 。

然后这道题目

.表示除\n之外的任意字符

*表示匹配0-无穷
+表示匹配1-无穷

(?=Expression) 顺序环视，(?=\\()就是匹配正括号

懒惰模式正则：
src=".*? (?=\\()） " *? 在正则中代表非贪婪匹配模式，会尽量少的匹配字符，

如果不加 ?就是贪婪模式，此时通配符会把所有字符都匹配掉，后面的就无效了

结果：北京市

因为匹配到第一个"就结束了一次匹配。不会继续向后匹配。因为他懒惰嘛。

正则表达式的基础认识

猜你喜欢