首先推荐一个在线测试正则表达式的网址:http://tool.oschina.net/regex
本文测试环境基于HTML5和JavaScript(JS)
使用正则表达式处理一个字符串时,如果只匹配一个值并将所有匹配替换成另一个值是比较简单的。例如:
// 目标字符串 var s = '"""asd !@#$%^&*()_+{}|":?><./;\][=-~` """ ff"" "V "ere " " rer"'; // 匹配其中所有的 " var r = /"/g; // 将其替换成 T var ss = s.replace(r, 'T'); // 结果为 TTTasd !@#$%^&*()_+{}|T:?><./;\][=-~` TTT ffTT TV Tere T T rerT alert(ss);
但是如果想不改变字符串开始和结束的“ " ”,只将中间的“ " ” 进行double。
一般处理方法可以分三步,第一步掐头,第二步去尾,第三步与上文类似即可。
如果想用一步就实现目标,就必须将字符串掐头去尾同时匹配并替换。正向思路是:
不能匹配开头的若干个“ " ”,且不能匹配结尾的若干个“ " ”,在此基础上,匹配所有的“ " ”并替换成自身的两倍。
基于这个思路我没找到结果。于是我利用正则中的子表达式概念,进行反向思路:
匹配开头的若干个“ " ”作为子表达式1,匹配结尾的若干个“ " ”作为子表达式2,匹配所有的“ " ”作为子表达式3
替换时,将子表达式1和2替换成自身,所以等同没有替换。将子表达式3替换两次。
这样就能达到掐头去尾匹配中间的目的。代码如下:
// 目标字符串 var s = '"""asd !@#$%^&*()_+{}|":?><./;\][=-~` """ ff"" "V "ere " " rer"'; // 匹配其中所有的 " var r = /(^"+)|("+$)|("+)/g; // 将其替换成 T var ss = s.replace(r, '$1$3$3$2'); // 结果为 """asd !@#$%^&*()_+{}|"":?><./;\][=-~` """""" ff"""" ""V ""ere "" "" rer" alert(ss);
注意,这里(^"+)|("+$)|("+) 分别按顺序代表:条件一 是不是开头的若干个“ " ”;条件二 是不是结尾的若干个“ " ”;条件三,是不是若干个“ " ”。匹配的过程中,开头的“ " ”会被记录为$1 结尾的不满足条件一,但会被记录为$2 其它的不满足条件一,二;才会被记录为$3。这样替换时才不会出错。
如果颠倒顺序为("+)|(^"+)|("+$) 所有的“ " ”都会记录为$1 后面两种均失效。
由此可见,正则表达式中,匹配的顺序也是很重要的。