两种方式解决数据库存入emoji报错:Incorrect string value: ´\xF0\x9F\xA4\xA3\xE3\x80...´ for column xxx

问题描述

往数据库里存入emoji表情的时候报了一个错: Incorrect string value: '\xF0\x9F\xA4\xA3\xE3\x80...' for column 'content' at row 1

原因

数据库使用的是utf-8编码格式 此时默认是使用3个字节为一个单位进行编码
而emoji表情是4个字节一个单位进行编码的
因此 这个需要4字节才能表示的emoji表情(准确说是Unicode字符)会被截断 从而导致存不进去 报错

解决方法

解决方法一

①、设置数据库默认字符集为utf8mb4
ALTER DATABASE 库名 CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
②、设置数据表的字符集为utf8mb4
ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_bin;
③、修改数据库连接地址

去掉地址的useUnicode=true&characterEncoding=utf-8

比如 我的地址为:
jdbc:mysql://000.000.000.000:3306/demo?useUnicode=true&characterEncoding=utf-8&useSSL=true&serverTimezone=UTC
那么我改成jdbc:mysql://000.000.000.000:3306/demo?useSSL=true&serverTimezone=UTC即可

解决方法二

通过第三方jar包进行转换

导入:

<dependency>
	<groupId>com.github.binarywang</groupId>
	<artifactId>java-emoji-converter</artifactId>
	<version>0.1.1</version>
</dependency>

在代码中进行转换:

private EmojiConverter emojiConverter = EmojiConverter.getInstance();
emojiConverter.toAlias(内容);

猜你喜欢

转载自blog.csdn.net/Piconjo/article/details/106916652