- Linux 下使用 iconv 命令可以转换文件的编码
iconv -f GBK -t UTF-8 input_file -o output_file
- C++ 代码 使用 iconv 函数
iconv 函数签名: size_t iconv(iconv_t cd,、
char **inbuf, size_t *inbytesleft,
char **outbuf, size_t *outbytesleft);
需要注意的是, iconv 函数的 inbuf 参数以及 outbuf 参数会被修改,内部的实现是使用类似
(*p)++ = xxx 的形式操作这两个指针,inbytesleft 会被修改为输入字符串剩余多少没有处理,
outbytesleft 会被修改为 outbuf 还有多少字节没有使用。iconv 返回 (size_t)-1 表示失
败,返回0表示成功,返回大于0表示出现了不可逆转的字符处理。
static std::string CharConv(const std::string& str, const char* fromcode, const char* tocode)
{
iconv_t cd = iconv_open(tocode, fromcode);
if (cd == (iconv_t)-1) {
printf("iconv_open failed, errno: %d\n", errno);
return str;
}
const size_t len = str.length();
const size_t outbuflen = len * 2;
char inbuf[len] = {0};
char outbuf[outbuflen] = {0};
memcpy(inbuf, str.data(), len);
char *pin = inbuf;
char *pout = outbuf;
size_t inlen = len;
size_t outbufleft = outbuflen;
size_t ret = iconv(cd, &pin, &inlen, &pout, &outbufleft);
if (ret == (size_t)-1) {
printf("iconv failed. errno: %d\n", errno);
iconv_close(cd);
return str;
}
iconv_close(cd);
return string(outbuf, outbuflen - outbufleft);
}