掐头去尾-利用正则表达式的匹配顺序

首先推荐一个在线测试正则表达式的网址:http://tool.oschina.net/regex

本文测试环境基于HTML5和JavaScript(JS)

 

使用正则表达式处理一个字符串时,如果只匹配一个值并将所有匹配替换成另一个值是比较简单的。例如:

 

 

// 目标字符串
var s = '"""asd  !@#$%^&*()_+{}|":?><./;\][=-~` """   ff"" "V  "ere " " rer"';
// 匹配其中所有的 "
var r = /"/g;

// 将其替换成 T
var ss = s.replace(r, 'T');

// 结果为 TTTasd  !@#$%^&*()_+{}|T:?><./;\][=-~` TTT   ffTT TV  Tere T T rerT
alert(ss);

但是如果想不改变字符串开始和结束的“ " ”,只将中间的“ " ” 进行double。

一般处理方法可以分三步,第一步掐头,第二步去尾,第三步与上文类似即可。

 

如果想用一步就实现目标,就必须将字符串掐头去尾同时匹配并替换。正向思路是:

不能匹配开头的若干个“ " ”,且不能匹配结尾的若干个“ " ”,在此基础上,匹配所有的“ " ”并替换成自身的两倍。

基于这个思路我没找到结果。于是我利用正则中的子表达式概念,进行反向思路:

匹配开头的若干个“ " ”作为子表达式1,匹配结尾的若干个“ " ”作为子表达式2,匹配所有的“ " ”作为子表达式3

替换时,将子表达式1和2替换成自身,所以等同没有替换。将子表达式3替换两次。

这样就能达到掐头去尾匹配中间的目的。代码如下:

 

// 目标字符串
var s = '"""asd  !@#$%^&*()_+{}|":?><./;\][=-~` """   ff"" "V  "ere " " rer"';
// 匹配其中所有的 "
var r = /(^"+)|("+$)|("+)/g;

// 将其替换成 T
var ss = s.replace(r, '$1$3$3$2');

// 结果为 """asd  !@#$%^&*()_+{}|"":?><./;\][=-~` """"""   ff"""" ""V  ""ere "" "" rer"
alert(ss);

注意,这里(^"+)|("+$)|("+) 分别按顺序代表:条件一 是不是开头的若干个“ " ”;条件二 是不是结尾的若干个“ " ”;条件三,是不是若干个“ " ”。匹配的过程中,开头的“ " ”会被记录为$1 结尾的不满足条件一,但会被记录为$2 其它的不满足条件一,二;才会被记录为$3。这样替换时才不会出错。  

如果颠倒顺序为("+)|(^"+)|("+$)  所有的“ " ”都会记录为$1 后面两种均失效。

由此可见,正则表达式中,匹配的顺序也是很重要的。

 

猜你喜欢

转载自gh-fisher.iteye.com/blog/2198064