如何让Nginx支持中文文件名具体设置步骤

时间:2021-12-08 18:03:04

首先得让你的系统有中语语言包: 

设置前可以执行:locale 看一下,如果显示是en_US.UTF-8,即是正常,不用按下面的步骤设置。如果显示其他编码需要按如下步骤设置。 

CentOS 

编辑/etc/sysconfig/i18n 文件,内容修改为:(可以使用vi、nano或winscp图形管理软件,依个人口味选择) 

LANG="en_US.UTF-8" 

SYSFONT="latarcyrheb-sun16" 

保存,重启系统。 

Debian 

apt-get install -y locales 

dpkg-reconfigure locales 

执行dpkg-reconfigure locales后会出现如下对话框: 

用向下的方向键找到en_US.UTF-8 UTF-8,按空格选择,再按回车键。 

再按向下键选择en_US.UTF-8,再按回车键确认,重启系统。 

Ubuntu 

编辑/etc/default/locale文件,修改内容为(没有的话创建一个): 

LANG="en_US.UTF-8" 

LANGUAGE="en_US:en" 

保存,再执行: 

locale-gen en_US en_US.UTF-8 

重启系统。 

执行:locale 看一下是否显示是en_US.UTF-8,如果报错,请在本文反馈。按以上步骤设置好后即可支持中文,可以上传中文的文件或中文的目录。 

在nginx.conf文件里配置的字符集也是utf-8 

server { 

listen 80; 

server_name test.cn; 

root /data; 

index index.html index.jsp; 

charset utf-8; 

…… 

ay%PM'G+U0 

客户端用的是secureCRT,用的字符集改为utf-8,用uft-8后再用rz上传文件,在ie下中文可以正常显示了。 

注意: 

如果中文文件名是gb2312的需要转换成utf-8.(注是文件名,不是文件内容)。使用convmv转换,(如果找不到这个命令,光盘中有这个包 convmv-1.10-1.el5.noarch.rpm)convmv -fGBK -tUTF8 -r--notesttarget 

其中-f是源编码,-t是目标编码,-r是递归处理目录,–notest是不移动,实际上对文件进行改名(actually do rename the files),target是目标目录。其余参数可以参考man或者-h。 

如果是在没有更改编码前上传的文件,设置好后依然会是乱码的,建议重新上传一下文件。如果没有原来文件的备份可以使用下面命令进行转换:for f in `ls *.html` ; do mv $f `ls $f|iconv -f GBK -t UTF-8`; done 。 

其中*.html为要转换的文件类型,也可以更换为*.txt,*.rar 主要是看你是什么文件了,里面的GBK为源文件的编码类型,如果不知道源文件的编码类型可以执行:file -bi 文件名 。 

如果想在Windows下改的话其实也是可以的Editplus就有批量修改文件编码的功能,其他的软件可能也有此类功能,可以自行研究一下。 

如果是目录的话,目前好像是没有办法进行转换。 

还有一个问题,如果是html之类的网页文件,如果原来是网页内容是gb2312或类似的非utf-8的编码,先要将网页里面的charset 改为charset=utf-8,再转换文件编码,否则网页还是会乱码的。 

convmv 可以从http://j3e.de/linux/convmv 下载, 

wget http://j3e.de/linux/convmv/convmv-1.14.tar.gz 

tar -zxvf convmv-1.14.tar.gz 

cd convmv-1.14 

make clean; 

make install; 

如: 

./convmv -f GB2312 -t UTF-8 -r --nosmart --notest userfiles/*.* 

以上表示 userfiles下的所有文件的文件名由GB2312转换为UTF-8 

对于文件内容的字符集转换可以使用iconv