Linux C++ 字符编码转换 GBK与UTF8互转

时间:2024-02-22 12:25:33
  1. Linux 下使用 iconv 命令可以转换文件的编码 iconv -f GBK -t UTF-8 input_file -o output_file
  2. C++ 代码 使用 iconv 函数

iconv 函数签名: size_t iconv(iconv_t cd,、
char **inbuf, size_t *inbytesleft,
char **outbuf, size_t *outbytesleft);
需要注意的是, iconv 函数的 inbuf 参数以及 outbuf 参数会被修改,内部的实现是使用类似
(*p)++ = xxx 的形式操作这两个指针,inbytesleft 会被修改为输入字符串剩余多少没有处理,
outbytesleft 会被修改为 outbuf 还有多少字节没有使用。iconv 返回 (size_t)-1 表示失
败,返回0表示成功,返回大于0表示出现了不可逆转的字符处理。

static std::string CharConv(const std::string& str, const char* fromcode, const char* tocode)
{
    iconv_t cd = iconv_open(tocode, fromcode);
	if (cd == (iconv_t)-1) {
		printf("iconv_open failed, errno: %d\n", errno);
		return str;
	}
	
	const size_t len = str.length();
    const size_t outbuflen = len * 2;
	char inbuf[len] = {0};
	char outbuf[outbuflen] = {0};

	memcpy(inbuf, str.data(), len);

	char *pin = inbuf;
	char *pout = outbuf;
	size_t inlen = len;
	size_t outbufleft = outbuflen;
	
	
	size_t ret = iconv(cd, &pin, &inlen, &pout, &outbufleft);
	if (ret == (size_t)-1) {
		printf("iconv failed. errno: %d\n", errno);
		iconv_close(cd);
		return str;
	}

	iconv_close(cd);
	return string(outbuf, outbuflen - outbufleft);
}