文本分析-全角字符串与半角字符串的转换 - 代码天地

文本分析-全角字符串与半角字符串的转换

其他 2018-10-23 10:31:30 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载 https://blog.csdn.net/zhang__shuang_/article/details/82503225

最近在做文本分析与挖掘时，涉及到了全角字符串与半角字符串的转换问题。在文本处理的相关问题上，半角和全角字符通常是数据预处理的必要过程，在此做个学习总结。

全角指的是一个字符占2个标准字符的位置（例如中国汉字）。
半角指的是占1个标准字符的位置（例如普通的字符a）。

全角字符包含两类字符：

特殊字符：空格，它的全角值十进制整数为12288，十六进制为0x3000，而其半角十进制整数值为32，十六进制结果为0x20.
有规律的字符，这类字符的全角十进制整数范围为[65281,65374]，十六进制[0xFF01,0xFF5E]，半角十进制整数值[33,126]，十六进制[0x21,0x7E].

除了空格外，有规律的字符在半角和全角之间的差值为65248，因此我们可以直接在全角数值上减去65248即可得到半角数值。

例如，全角字符串“0 0 5 2 7 8 2 5 C B D”转换为半角字符串的结果是“00527825CBD”。

注意：
并不是所有的全角字符都能被转换为半角字符，例如汉字是全角字符，占2个字符的位置，但它无法被转换；只有英文字母、数字键、符号键等才能可以做全角和半角之间的转换。

猜你喜欢

转载自blog.csdn.net/zhang__shuang_/article/details/82503225

文本分析-全角字符串与半角字符串的转换

提供对字符串的全角->半角，半角->全角转换

字符串全角半角转换

Java将字符串中的全角字符转成对应的半角字符

计算中文或全角字符串的长度

全角与半角字符串或字符之间的转换Java工具类BCConvert

java 判断字符和字符串是否为全角字符

Oracle 全角字符和半角字符转换

全角字符转半角字符

全角字符半角字符区别

Java 全角字符转半角字符 Java 全角字符转半角字符

js字符串： String对象的方法 + 半角空格、全角空格

Java如何判断字符串中包含有全角,半角符号

java 如何判断字符串中包含有全角,半角符号

python实现字符串中的半全角转换

一行代码将全角字符转换为半角字符

Python3 全角字符和半角字符互相转换(亲测可用)

【Android】全角字符半角字符工具类

JS - 实现全角字符转半角字符处理

PHP实现全角字符转为半角的方法

python 全角半角字符转换

字符串转换

字符串的转换

认识全角字符

字符串转换日期，日期转换字符串

JS字符串转换

字符串 bool转换

字符串，列表转换

字符串与列表的转换

leetcode 字符串转换

今日推荐

周排行

rac环境打PSU补丁ERROR:This patch is not applicable to GI home.

科学活动《离园倒计时》（时间）

Windows 沙箱开发踩坑

secureCRT 改变显示宽度

hdu多校第六场1008 （hdu6641）TDL 暴力

【low向】注册用户时密码强度的判定

__int64

context-params与init-params

JS三个编码函数和net编码System.Web.HttpUtility.UrlEncode比较

springboot通过重写addResourceHandlers拦截请求访问本地资源

每日归档

更多

2024-08-08(0)

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)