前言
有的时候我们在查看数据库数据时,会看到乱码。实际上,无论何种数据库只要出现乱码问题,这大多是由于数据库字符集设定的问题。
下面我们就介绍一下,数据库的字符集的设定及乱码问题的解决。
mysql数据库的字符集
直白的说,字符就像是单个的文字,编码就像是给每个文字的编号,字符集就像是字符与编码的集合,校验规则就是字符集的对应的排序规则,字符集加上对应的校验规则就是语言。(每种字符集可以有多种校对规则,但都有一个默认的校对规则)
mysql数据库可以通过设定字符集,来使用对应的字符集和检验规则来组织字符。就像是解读一片文章的时候用那种语言来解析。例如:中国人常使用的utf8编码,代表的是中文。
mysql可以支持多种字符集。在同一个数据库的不同表,同一个表中的不同字段,都可以指定使用不同的字符集。
mysql的字符集规则
mysql可以设定的字符集:
- 服务器的字符集
- 数据库的字符集
- 表的字符集
- 字段的字符集
如果在某一个级别没有设置字符集,则它会继承其上一级的字符集。
mysql数据库乱码问题解决方法(即修改字符集方法)
【1】查看mysql支持的字符集
show character set;
【2】查看数据库编码
show variables like ‘character_set%’;
【3】查看当前mysql使用的字符集
show variables like ‘character%’;
解析:
character_set_client:客户端请求数据的字符集
character_set_connection:客户机与服务器连接的字符集
character_set_database:默认数据库的字符集;如果没有默认数据库,就会使用 character_set_server指定的字符集(建议不要随意更改)
character_set_filesystem:把 character_set_client转换character_set_filesystem (默认为binary, 不做任何转换)
character_set_results:返回给客户端的字符集
character_set_server:数据库服务器的默认字符集
character_set_system:系统字符集,默认utf8。(用于数据库的表、列和存储在目录表中函数的名字)
character_sets_dir:mysql字符集文件的保存路径
产生乱码的原因
character_set_client与实际不符合
character_set_results与客户端页面不符合
【4】查看当前数据库的校对规则
show variables like ‘collation%’;
解析:
value的命名规则: 字符集名字+语言+后缀
collation_connection :当前连接的字符集
collation_database :当前日期的默认校对
collation_server :服务器的默认校对
后缀的含义:
ci:不区分大小写
cs:区分大小写
bin:二进制排序
【5】更改字符集
解决乱码问题(一般如下)
set character_set_client = ‘utf8’;
set character_set_connection = ‘utf8’;
set character_set_results = ‘utf8’;
或
set names utf8;
或
在mysql的my.cnf的配置文件中修改或添加下列:
[client]
default-character-set = utf8
[mysqld]
character_set_server = utf8