JS区分中英文字符的两种方法: 正则和charCodeAt()方法

JS区分中英文字符的两种方法: 正则和charCodeAt()方法。

正则无疑是最强大的判断各种条件的方法, 最近也在研习它, 虽然枯燥, 但仍有乐趣. 用它来判断一个双字节的中文字符也是轻而易举地. 而判断中文字符,  简单且执行效率高.

regExpForm.onblur=function(){
        entryVal=this.value;
        entryLen=entryVal.length;
        cnChar=entryVal.match(/[^\x00-\x80]/g);//利用match方法检索出中文字符并返回一个存放中文的数组
        entryLen =cnChar.length;//算出实际的字符长度
    }


第二种方法是通过charCodeAt()方法判断Unicode码值, 若大于255即为中文字符, 它的执行效率没有正则高, 也没有正则简单.


 

entryVal=this.value;
        entryLen=entryVal.length;
        for(var i=0;i<entryVal.length;i  ){
            if(entryVal.charCodeAt(i)>255){//遍历判断字符串中每个字符的Unicode码,大于255则为中文
                cnArr.push(entryVal[i]);//讲符合条件的值插入到中文字符数组中
                //注意一个小bug,push是向数组的末尾添加一个或多个元素并返回新的长度,所以未刷新的情况下反复blur会累加字符值
            }
        }
        entryLen =cnArr.length;

实例

function getLength(){

var str='',n=null;

for(var i=0;i<str.length;i++){

if(str.charCodeAt(i)>=0&&str.charCodeAt(i)<=256){n+=2;}

else{n+=1;}

}

}
 

2、正则表达式
一般的中文字符集用[ \u4e00-\u9fa5]即可,若想要匹配多种类型汉字或者其他的特殊字符,可以用 [ \u2E80-\uFE4F]。

用法:var len=str.match(/[\u4e00-\u9fa5]/); //可以返回含有中文字符的数组。
            console.log(2*len.length);                         //即可得到汉字字符串的字符个数

实例

/*获取数字部分:Unicode编码值范围在[48~57]之间即为数字
 *获取英文字母部分:Unicode编码值范围在[65~90],以及[97~122]之间即为英文字母
 *获取中文部分(大于122)
*/
//charCodeAt()方法
            function get(str) {
                var saveNum = new Array(); //接收数字
                var saveLowerLetter = new Array(); //接收大写英文字母
                var saveUpperLetter = new Array(); //接收小写英文字母
                var saveChina = new Array(); //接收中文
                for(var i=0; i<str.length; i++) {
                    if((str[i].charCodeAt()) >= 48 && (str[i].charCodeAt()) <= 57) {
                        saveNum.push(str[i]);
                    }else if((str[i].charCodeAt()) >= 65 && (str[i].charCodeAt()) <= 90) {
                        saveUpperLetter.push(str[i]);
                    }else if((str[i].charCodeAt()) >= 97 && (str[i].charCodeAt()) <= 122) {
                        saveLowerLetter.push(str[i]);
                    }else if ((str[i].charCodeAt()) > 122) {
                        saveChina.push(str[i]);
                    }
                }
                document.write(saveNum + "<br>"); //1,2,3,4,1,8,7,2
                document.write(saveLowerLetter + "<br>");//l,a,l,a,l,l,a
                document.write(saveUpperLetter + "<br>");//H,A,H,A,H,A
                document.write(saveChina + "<br>"); //我,是,喵,喵,喵,嘿,嘿
            }
            get("我是1234喵喵喵lalalla嘿嘿HAHAHA1872");
 

猜你喜欢

转载自blog.csdn.net/bujiongdan/article/details/83178698