MySQL将utf8字符集改为utf8mb4

时间:2023-01-11 12:52:19
  • 前言
    今天在查看tomcat日志时发现了一个错误:Cause: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x82\xF0\x9F...' for column 'name' at row 1
    在网上查找了说是mysql的字符集编码的问题,因为mysql的utf8编码最大是3个字节,而现在比较流行的emoji表情是四个字节的,所以导致mysql报错。MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换。所以utf8mb4要比utf8浪费点空间,但是还是推荐使用utf8mb4,原因就是手机上网的用户太多了, 随便输入一个[emoji]表情mysql就存不了,其合理性可想而知。
  • 解决方案
    因为我们使用的是阿里云的rds mysql,所以不能修改配置文件,所以只能修改数据库和表和字段
    #数据库
    ALTER DATABASE database_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
    #表
    ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
    #字段
    ALTER TABLE table_name CHANGE column_name column_name VARCHAR(191) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
    然后我们使用sql语句检查表的编码
    SHOW CREATE TABLE `user`;
  • 关于mysql的字符集还是有很多知识的,比如utf8_bin与utf8_unicode_ci和utf8_unicode_cs还有utf8_general_ci和utf8_general_cs他们之间的区别与联系都可以了解一下哦