WEB_tar打包 后中文文件名乱码的问题

时间:2023-02-10 10:00:42

原文地址:http://blog.csdn.net/agoago_2009/article/details/28270257


tar zcvf xxx.tar.gz *files 

tar jcvf xxx.tar.bz2 *files 

因文件名有中文字符,放到windows的机器上后解压中文变成乱码。 


7zip和rar会记录字符集,自动转换,而tar不会: 

比如 “中国.txt”,utf-8下编码是e4b8ade59bbd,tar里面记录的是e4b8ade59bbd.tar,然后gbk下中国不是e4b8ade59bbd,所以就是乱码了,zip也不保存字符集。 

在linux下只能用rar或者7zip处理中文文件名的文件。 


=================================================== 

归根结底是因为linux和windows字符集设置得不同: 

windows的机制是本地编码来记录文件名,本地编码的字符集是跟Locale(多语种支持)相关的,而Locale又跟你安装系统所选区域语言有关,由此,windows支持很多种字符

码的,跟你安装的linux的字符编码并不一定一致,而且单单中文的编码就有很多种,所以你只需要将两个对应系统的字符编码设置为相同即可。 

1. #LANG="跟windows统一的字符集" SYSFONT="latarcyrheb-sun16" SUPPORTED="跟windows统一的字符集:x:x" 

当然,用工具软件方便得多,像7zip等都可以实现。