普通dos编码文件批量转换为UTF-8格式文件

时间:2023-01-06 13:21:32

    今天发现巨好用工具EditPlus,批量转换文件编码格式

    文档(Document)菜单——文件编码(File encoding)——批量转换编码(File encoding multiple),选中全部文件后转码,然后再全部保存

    

    最近将windows下的代码移到linux平台,发现linux下对中文支持的不好,导致代码文件里中文注释部分全为乱码,

因此,在移到linux平台前将普通的dos代码文件批量转换为UTF-8格式文件。

这里采用perl处理:

use strict;
use warnings;
use Encode;

open(IN, "<", "test.dos");
open(OUT, ">", "test.utf8");

while(<IN>){
chomp();
my $line = Encode::decode("gb2312", $_); # 必须知道文件的原始编码格式
$line = Encode::encode("UTF-8", $line);
print OUT "$line\n";
}
close(IN);
close(OUT);</span>