先说结论
中文字符截取,使用
char_length(str)
来获取字符串长度
截取方法:left(str, char_length(str) - 2)
问题复现
我的需求是,需要把数据库中的脏数据,最后两个中文字符删掉
第一个想法就是通过 sql 语句进行截断,所以测试了 LEFT(str, length)
方法
感觉通过 left 可以完美解决我的问题。
然后,实际找了一条数据去做测试,但是却没法删掉最后的社区
两个汉字
通过查询尝试和查询资料,才发现是 length
方法的问题,换成 char_length
即可
原因分析
left
方法 在截取 中文字符 “测试社区” 时, length
方法是按照字节为单位,一个汉字在 utf8 下三个字节,在 GBK 下两个字节
String str = "测试社区";
// 实际判断后, str 长度是 4
// left(str, length(str) - 2) length 在 utf8 编码下,长度为 12 字节
String sub = str.subString(0, 12 - 2);
// 所以 sub 还是 "测试社区";