比较准确完整的中文字符正则校验 - 代码天地

比较准确完整的中文字符正则校验

其他 2018-11-08 12:27:55 阅读次数: 0

网上大多数校验中文的正则都是\u4e00-\u9fa5，经过实际测试，这个正则无法匹配中文标点，如（），。等

仔细研究了unicode的规范，本着尽量宽泛、遵循unicode分类的原则，总结了一套比较准确完整的校验规则：

// http://www.unicode.org/charts/PDF/U2000.pdf 一般标点
// http://www.unicode.org/charts/PDF/U3000.pdf CJK符号和标点
// http://www.unicode.org/charts/PDF/U4E00.pdf CJK统一表意文字
// http://www.unicode.org/charts/PDF/UFF00.pdf 半宽全宽形状
String COMMON_STRING_REGEX = "[\u2000-\u206f\u3000-\u303f\u4e00-\u9fef\uff00-\uffef]*";

　　

猜你喜欢

转载自www.cnblogs.com/demonbug/p/9928231.html

比较准确完整的中文字符正则校验

正则匹配中文字符

python 正则匹配中文字符

正则判断中文字符

php 正则匹配中文及中文字符

eclispe用正则全局搜索中文字符

正则替换文档里面的中文字符

sql正则化过滤非中文字符

中文字符的存储

中文字符脱敏

PHP正则判断某字符串中是否包含中文字符

Python----使用正则re查找文本中特定中文字符串

android studio 全局搜索中文字符正则表达式

手机号，邮箱，中文字符 js正则验证

Python 中文字符串正则表达式

c++ boost 正则表达式验证中文字符

正则表达式替换中文字符前面的换行符

angular6 正则表达式允许输入部分中文字符

正则表达式，匹配所有非中文字符

python中正则表达式在中文字符串匹配时的坑

[转]匹配中文字符的正则表达式

Notepad++正则表达式查找替换文本中文字符

tesseract 识别中文字符

python 允许出现中文字符

Java 完美判断中文字符

mysql 中文字符解决

cookie中存取中文字符

java判断中文字符

url 中文字符处理

查找并替换中文字符

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)