Hive设置MySQL元数据中文乱码编码问题以及解决

时间:2024-03-29 17:44:13

Hive设置MySQL元数据编码问题

表或者字段有中文的时候需要修改hive的元数据库的设置。
以mysql为例子,当mysql的字符集设置成utf8的时候使用hive会有问题(一些命令直接不能执行),详细见hive的wiki。

所以当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1。

Hive设置MySQL元数据中文乱码编码问题以及解决

1. 但是,因为MySQL通过my.cnf一般情况下设置为utf-8编码,因此需要在创建Hive元数据库时,需要将MySQL中的hive库改回latin1。

alter database hive character set latin1;

 

2.为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。

修改字段注释字符集

Hive设置MySQL元数据中文乱码编码问题以及解决

alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;

修改表注释字符集

 alter table TABLE_PARAMS modify column PARAM_VALUE varchar(256) character set utf8; 

最后别忘记修改hive的jdbc连接,将字符集修改为utf8,如

javax.jdo.option.ConnectionURL
jdbc:mysql://192.168.0.128:3306/hive?characterEncoding=UTF-8