JS区分中英文字符的两种方法: 正则和charCodeAt()方法

JS区分中英文字符的两种方法: 正则和charCodeAt()方法。

正则无疑是最强大的判断各种条件的方法, 最近也在研习它, 虽然枯燥, 但仍有乐趣. 用它来判断一个双字节的中文字符也是轻而易举地. 而判断中文字符, 简单且执行效率高.

regExpForm.onblur=function(){
        entryVal=this.value;
        entryLen=entryVal.length;
        cnChar=entryVal.match(/[^\x00-\x80]/g);//利用match方法检索出中文字符并返回一个存放中文的数组
        entryLen =cnChar.length;//算出实际的字符长度
    }

第二种方法是通过charCodeAt()方法判断Unicode码值, 若大于255即为中文字符, 它的执行效率没有正则高, 也没有正则简单.

entryVal=this.value;
        entryLen=entryVal.length;
        for(var i=0;i<entryVal.length;i  ){
            if(entryVal.charCodeAt(i)>255){//遍历判断字符串中每个字符的Unicode码,大于255则为中文
                cnArr.push(entryVal[i]);//讲符合条件的值插入到中文字符数组中
                //注意一个小bug,push是向数组的末尾添加一个或多个元素并返回新的长度,所以未刷新的情况下反复blur会累加字符值
            }
        }
        entryLen =cnArr.length;

实例

function getLength(){

var str='',n=null;

for(var i=0;i<str.length;i++){

if(str.charCodeAt(i)>=0&&str.charCodeAt(i)<=256){n+=2;}

else{n+=1;}

}

2、正则表达式
一般的中文字符集用[ \u4e00-\u9fa5]即可，若想要匹配多种类型汉字或者其他的特殊字符，可以用 [ \u2E80-\uFE4F]。

用法：var len=str.match(/[\u4e00-\u9fa5]/); //可以返回含有中文字符的数组。
console.log(2*len.length); //即可得到汉字字符串的字符个数

实例

/*获取数字部分：Unicode编码值范围在[48~57]之间即为数字
*获取英文字母部分：Unicode编码值范围在[65~90]，以及[97~122]之间即为英文字母
*获取中文部分(大于122)
*/
//charCodeAt()方法
function get(str) {
var saveNum = new Array(); //接收数字
var saveLowerLetter = new Array(); //接收大写英文字母
var saveUpperLetter = new Array(); //接收小写英文字母
var saveChina = new Array(); //接收中文
for(var i=0; i<str.length; i++) {
if((str[i].charCodeAt()) >= 48 && (str[i].charCodeAt()) <= 57) {
saveNum.push(str[i]);
}else if((str[i].charCodeAt()) >= 65 && (str[i].charCodeAt()) <= 90) {
saveUpperLetter.push(str[i]);
}else if((str[i].charCodeAt()) >= 97 && (str[i].charCodeAt()) <= 122) {
saveLowerLetter.push(str[i]);
}else if ((str[i].charCodeAt()) > 122) {
saveChina.push(str[i]);
}
}
document.write(saveNum + "<br>"); //1,2,3,4,1,8,7,2
document.write(saveLowerLetter + "<br>");//l,a,l,a,l,l,a
document.write(saveUpperLetter + "<br>");//H,A,H,A,H,A
document.write(saveChina + "<br>"); //我,是,喵,喵,喵,嘿,嘿
}
get("我是1234喵喵喵lalalla嘿嘿HAHAHA1872");

JS区分中英文字符的两种方法: 正则和charCodeAt()方法

实例

实例

猜你喜欢