- 前言
今天在查看tomcat日志时发现了一个错误:Cause: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x82\xF0\x9F...' for column 'name' at row 1
在网上查找了说是mysql的字符集编码的问题,因为mysql的utf8编码最大是3个字节,而现在比较流行的emoji表情是四个字节的,所以导致mysql报错。MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换。所以utf8mb4要比utf8浪费点空间,但是还是推荐使用utf8mb4,原因就是手机上网的用户太多了, 随便输入一个[emoji]表情mysql就存不了,其合理性可想而知。 - 解决方案
因为我们使用的是阿里云的rds mysql,所以不能修改配置文件,所以只能修改数据库和表和字段
然后我们使用sql语句检查表的编码#数据库 ALTER DATABASE database_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci; #表 ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; #字段 ALTER TABLE table_name CHANGE column_name column_name VARCHAR(191) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
SHOW CREATE TABLE `user`;
- 关于mysql的字符集还是有很多知识的,比如utf8_bin与utf8_unicode_ci和utf8_unicode_cs还有utf8_general_ci和utf8_general_cs他们之间的区别与联系都可以了解一下哦
相关文章
- mac下修改mysql的默认字符集为utf8
- mac下修改mysql默认字符集为utf8
- Java Unicode编码 及 Mysql utf8 utf8mb3 utf8mb4 的区别与utf8mb4的过滤
- MySQL字符编码的讨论:如何处理emoji等4字节的Unicode字符 - utf8mb4 vs. utf8 Collations
- MySQL - utf8mb4字符集设置(解决emoji表情的记录无法保存问题)
- MySQL 解决 emoji表情 的方法,使用utf8mb4 字符集(4字节 UTF-8 Unicode 编码)
- MySQL 解决 emoji表情 的方法,使用utf8mb4 字符集(4字节 UTF-8 Unicode 编码)
- PHP 将字符串转换为字符集格式UTF8/GB2312/GBK 函数iconv()
- 函数:PHP将字符串从GBK转换为UTF8字符集iconv
- php判断字符串的编码以及将字符串从GBK转换为UTF8字符集