数据库需要适应各种语言和字符就需要支持不同的字符集(Character Set),每种字符集也有各自的排序规则(Collation)。
(注意:Collation原意为校对,校勘,但是根据实际使用场景,觉得还是翻译为排序规则比较合适)
在绝大部分情形中,使用何种字符集和排序规则决定于服务器,数据库和表的级别,一般SQL操作不必关心这些。
以下操作均以MySQL为例。
查看数据库支持的字符集与排序规则
查看字符集:
SHOW CHARACTER SET;
部分结果:
查看排序规则:(后缀"_cs"或者"_ci"意思是区分大小写和不区分大小写(Case Sensitive & Case Insensitve))
SHOW COLLATION;
部分结果:
使用数据库支持的字符集与排序规则
通常系统管理在安装时定义一个默认的字符集和排序规则,
也可以在创建数据库时对数据库范围,建表时对表级别,甚至列级别设置字符集和排序规则。
> 下图为建数据库时指定字符集和排序规则:
为了确定所用的字符集和排序规则,可以使用下列语句:
SHOW VARIABLES LIKE 'character%'; SHOW VARIABLES LIKE 'collation%';
> 建表时指定表的字符集和排序规则:
1 CREATE TABLE mytable ( 2 column1 INT, 3 column2 VARCHAR (10) 4 ) DEFAULT CHARACTER SET hebrew 5 COLLATE hebrew_general_ci;
不指定字符集和排序规则时使用数据库默认设置,若指定了字符集没有指定排序规则,则使用字符集的默认排序规则。
>建表时指定表和列的字符集和排序规则
CREATE TABLE mytable ( column1 INT, column2 VARCHAR (10), column3 VARCHAR (10) CHARACTER SET latin1 COLLATE latin1_general_ci ) DEFAULT CHARACTER SET hebrew COLLATE hebrew_general_ci;
>自定义查询语句中ORDER BY的排序规则
SELECT * FROM `mytable` ORDER BY `column1` COLLATE latin1_general_cs;
这里的使用不限于ORDER BY,还有GROUP BY,聚集函数等。
参考文章:
【1】MySQL必知必会 2009年1月第一1版 第27章 “全球化与本地化”