一:异常信息:errorCode:1366
Caused by: java.sql.SQLException: Incorrect string value: '\xE7\xAE...' for column 'description' at row 1
二:异常原因:字符集冲突
mysql insert入库的时候,由于插入数据编码与数据库字段字符集不一致,导致数据无法插入。
三:追本溯源
在mysql数据库中执行show character set,可以看到不同的字符集的最大长度不同。
如果执插入utf8编码数据,数据库表中字段字符集是latin。(查询字段字符集方法:show full columns from user;)
如果最大长度为3的utf8字符集存储到最大长度为1的latin数据库字段中,数据会被截断,无法正常插入,导致异常。
我们可以通过 下面命令来查询它的编码格式:
show variables like 'character%';
发现它的编码格式变成了Latin1 如图:
四:解决办法
修改数据库的字符集编码
MySQL配置文件在Windows下叫my.ini,在MySQL的安装根目录下;在Linux下叫my.cnf,该文件位于/etc/my.cnf。
(1)window服务器
mysql数据库的配置文件my.ini,此文件放在mysql根目录下。在此文件下查找default-character-set属性,并将其值更改为utf8,要是包含其他特殊字符需要改为utf32:default-character-set = utf8(或者default-character-set = utf32)
(2)linux服务器修改my.cnf
vi /etc/my.cnf
在[client]下添加
default-character-set=utf8
default-character-set=utf8
报的是pid文件更新问题。
经过查看mysql日志,如下:
是default-character-set参数不可用。
新版本mysql(mysql5.5以上的版本)配置方法是
在[mysqld]下把default-character-set=utf8换成character-set-server=utf8就可以了
注意:character-set-server=utf8不可与default-character-set=gbk同时存在,否则可能引发mysql服务无法启动,发生系统错误1067,把该语句注释即可。
重启mysql可以使用 sudo /etc/init.d/mysql restart注意修改数据库编码以后,需要把以前的数据库删除掉,重新建立。
注意:
在用navicat可视化软件时,需要更改一下设置:
“编辑数据库”,字符要改为utf32或utf8,下面我们就去改,同时在表的右键点击“设计表”,看到如下,点击表的设计:
点击字符集改为utf32,排序规则也要相应的改变(我遇到的1366问题就是通过修改Navicat的字符集和排列规则为utf32,成功运行纠结了好几天的问题)。详情可以参考百度经验: https://jingyan.baidu.com/article/624e74594e508834e8ba5aca.html
(1)字符(Character)是指人类语言中最小的表义符号。例如'A'、'B'等;
给定一系列字符,对每个字符赋予一个数值,用数值来代表对应的字符,这一数值就是字符的编码(Encoding)。例如,我们给字符'A'赋予数值0,给字符'B'赋予数值1,则0就是字符'A'的编码;
给定一系列字符并赋予对应的编码后,所有这些字符和编码对组成的集合就是字符集(Character Set)。例如,给定字符列表为{'A','B'}时,{'A'=>0, 'B'=>1}就是一个字符集;
(2)字符序(Collation)是指在同一字符集内字符之间的比较规则;确定字符序后,才能在一个字符集上定义什么是等价的字符,以及字符之间的大小关系;
每个字符序唯一对应一种字符集,但一个字符集可以对应多种字符序,其中有一个是默认字符序(Default Collation);
MySQL中的字符序名称遵从命名惯例:以字符序对应的字符集名称开头;以_ci(表示大小写不敏感)、_cs(表示大小写敏感)或_bin(表示按编码值比较)结尾。例如:在字符序``utf8_general_ci''下,字符``a''和``A''是等价的;
(3)MySQL字符集设置系统变量:
– character_set_server:默认的内部操作字符集
– character_set_client:客户端来源数据使用的字符集
– character_set_connection:连接层字符集
– character_set_results:查询结果字符集
– character_set_database:当前选中数据库的默认字符集
– character_set_system:系统元数据(字段名等)字符集