python re库正则表达式

python-常用正则表达式

匹配中文字符的正则表达式:    [u4e00-u9fa5]                        
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了                
匹配双字节字符  ( 包括汉字在内  ) : [^x00-xff]                    
评注:可以用来计算字符串的长度(一个双字节字符长度计    2 , ASCII    字符计  1 )
匹配空白行的正则表达式:    ns*r                                
评注:可以用来删除空白行                                    
匹配 HTML  标记的正则表达式:    <(S*?)[^>]*>.*?|<.*? />                
评注:网上流传的版本太糟糕,    上面这个也仅仅能匹配部分,    对于复杂的嵌套标记依旧
无能为力                                            
匹配首尾空白字符的正则表达式:        ^s*|s*$                        
评注:可以用来删除行首行尾的空白字符    ( 包括空格、制表符、换页符等等    ) ,非常有用
的表达式                                            
匹配 Email  地址的正则表达式:    w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*            
评注:表单验证时很实用                                    
匹配网址  URL 的正则表达式:  [a-zA-z]+://[^s]*                    
评注:网上流传的版本功能很有限,上面这个基本可以满足需求                
匹配帐号是否合法    ( 字母开头,允许    5-16    字节,允许字母数字下划线    ) :        
^[a-zA-Z][a-zA-Z0-9_]{4,15}$                                    
评注:表单验证时很实用                                    
匹配国内电话号码:   d{3}-d{8}|d{4}-d{7}                        
评注:匹配形式如    0511-4405222    或  021-87888822                
匹配腾讯  QQ 号: [1-9][0-9]{4,}                                
评注:腾讯  QQ 号从 10000  开始                            
匹配中国邮政编码:    [1-9]d{5}(?!d)                            
评注:中国邮政编码为    6 位数字                            
匹配身份证:  d{15}|d{18}                                    
评注:中国的身份证为    15    位或 18    位                        
匹配 ip 地址: d+.d+.d+.d+                                    
评注:提取  ip 地址时有用                                    
匹配特定数字:                                            
^[1-9]d*$    // 匹配正整数                                
^-[1-9]d*$    // 匹配负整数                                
^-?[1-9]d*$        // 匹配整数                                
^[1-9]d*|0$    // 匹配非负整数(正整数    + 0    )                
^-[1-9]d*|0$        // 匹配非正整数(负整数    + 0  )                
^[1-9]d*.d*|0.d*[1-9]d*$            // 匹配正浮点数                
^-([1-9]d*.d*|0.d*[1-9]d*)$            // 匹配负浮点数                
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$                // 匹配浮点数            
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$            // 匹配非负浮点数(正浮点数    + 0    )
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$            // 匹配非正浮点数(负浮点数    +

0 )

评注:处理大量数据时有用,具体应用时注意修正

匹配特定字符串:

^[A-Za-z]+$        // 匹配由 26 个英文字母组成的字符串
^[A-Z]+$        // 匹配由 26    个英文字母的大写组成的字符串
^[a-z]+$        // 匹配由  26    个英文字母的小写组成的字符串
^[A-Za-z0-9]+$    // 匹配由数字和    26 个英文字母组成的字符串
^w+$    // 匹配由数字、  26 个英文字母或者下划线组成的字符串
在使用 RegularExpressionValidator        验证控件时的验证功能及其验证表达式介绍如
下:                        
只能输入数字:  “^[0 - 9]*$ ”            
只能输入  n 位的数字:  “^d{n}$ ”            
只能输入至少    n 位数字: “^d{n,}$  ”        
只能输入  m-n    位的数字: “^d{m,n}$ ”        
只能输入零和非零开头的数字:    “^(0|[1    -9][0-    9]*)$ ”
只能输入有两位小数的正实数:“^[0 -9]+(.[0-    9]{2})?$  ”
只能输入有    1-3  位小数的正实数:  “^[0 -9]+(.[0-    9]{1,3})?$  ”
只能输入非零的正整数:   “^+?[1 -9][0-    9]*$ ”    
只能输入非零的负整数:   “^-[1-9][0-    9]*$ ”    
只能输入长度为    3 的字符: “^.{3}$    ”        
只能输入由  26    个英文字母组成的字符串:   “^[A -Za-  z]+$ ”
只能输入由  26    个大写英文字母组成的字符串:“^[A - Z]+$ ”
只能输入由  26    个小写英文字母组成的字符串:    “^[a - z]+$ ”

只能输入由数字和    26 个英文字母组成的字符串:    “^[A -Za-z0-  9]+$ ”    
只能输入由数字、    26 个英文字母或者下划线组成的字符串:    “^w+$”    
验证用户密码  : “^[a -zA- Z]w{5,17}$ ”    正确格式为: 以字母开头, 长度在 6-18    之间,
只能包含字符、数字和下划线。                        
验证是否含有  ^%&'',;=?$"    等字符: “[^%&'',;=?$x22]+    ”        
只能输入汉字:  “^[u4e00  - u9fa5],{0,}$    ”                
验证 Email  地址: “^w+[    -+.]w+)*@w+([-.]w+)*.w+([-        .]w+)*$ ”    
验证 InternetURL    : “^http://([w    -]+.)+[w-]+(/[w-        ./?%&=]*)?$ ”    
验证电话号码:  “^((d{3,4})|d{3,4}        - )?d{7,8}$    ”            
正确格式为:  “XXXX- XXXXXXX”    , “XXXX- XXXXXXXX”   , “XXX- XXXXXXX”   ,
“XXX- XXXXXXXX”    , “XXXXXXX” , “XXXXXXXX”  。            
验证身份证号(    15 位或 18 位数字): “^d{15}|d{}18$    ”        
验证一年的  12    个月: “^(0?[1  -9]|1[0-    2])$ ”正确格式为:  “01”-“09”和 “1”“ 12”
验证一个月的  31    天: “^((0?[1    -9])|((1|2)[0-9])|30|31)$    ”    
正确格式为:  “01”“ 09和”“1”“ 31。”                    
匹配中文字符的正则表达式:    [u4e00-u9fa5]                
匹配双字节字符  ( 包括汉字在内  ) : [^x00-xff]                
匹配空行的正则表达式:   n[s| ]*r                        
匹配 HTML  标记的正则表达式:    /<(.*)>.*|<(.*) />/                
匹配首尾空格的正则表达式:    (^s*)|(s*$)                    
匹配 Email  地址的正则表达式:    w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*    
匹配网址  URL    的正则表达式:  http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?    
(1) 应用:计算字符串的长度(一个双字节字符长度计    2 , ASCII  字符计  1 )    
String.prototype.len=function(){return                    

this.replace([^x00-xff]/g,"aa").length;}

(2) 应用: javascript    中没有像  vbscript    那样的  trim    函数,我们就可以利用这个表达

式来实现

String.prototype.trim = function()

{

return this.replace(/(^s*)|(s*$)/g, "");

}

(3) 应用:利用正则表达式分解和转换    IP 地址

function IP2V(ip) //IP    地址转换成对应数值

{

re=/(d+).(d+).(d+).(d+)/g //    匹配 IP 地址的正则表达式

if(re.test(ip))

{

return

RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*25 5+RegExp.$4*1

}

else

{

throw new Error("Not a valid IP address!")

}

}

(4) 应用:从 URL 地址中提取文件名的 javascript 程序 s="http://www.9499.net/page1.htm"; s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2") ;//Page1.htm

(5) 应用:利用正则表达式限制网页表单里的文本框输入内容

用正则表达式限制只能输入中文:

onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'')

"onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'')

.replace(/[^u4E00-u9FA5]/g,''))"

用正则表达式限制只能输入全角字符:

onkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'')

"onbeforepaste="clipboardData.setData(''text'',clipboardData.getData(''text'')

.replace(/[^uFF00-uFFFF]/g,''))"

用正则表达式限制只能输入数字:    onkeyup="value=value.replace(/[^d]/g,'')

"onbeforepaste=

"clipboardData.setData(''text'',clipboardData.getData(''text'').replace(/[^d]/g,

''))"

猜你喜欢

转载自blog.csdn.net/qq_44647926/article/details/89383250