使用iconv转换出现“非法输入序列”的问题

时间:2021-10-27 08:44:32

如题:

我只选择最关键的语句:iconv -f gb18030 -t utf-8 $1 > $2

这样会出现“未知xxx处的非法输入序列”,我想可能是有些汉字字符识别不出来

于是,我把它改为iconv -c -f gb18030 -t utf-8 $1 > $2,多加了一个-c,忽略无效的字符

发现转化过来基本正确(起码汉字的翻译全对了,也没有丢失数据),但是有个小地方出错了,如下图

使用iconv转换出现“非法输入序列”的问题

而且转化过来的大小也不一样,如下图

使用iconv转换出现“非法输入序列”的问题

这个有办法解决吗?假如代码量比较大的话,转过来又要去核对是否正确,那也是相当麻烦,而且一点都不可靠