字符集编码转换问题

时间:2022-01-11 08:40:17

    在LINUX上进行编码转换时,既可以利用iconv函数族编程实现,也可以利用iconv命令来实现,只不过后者是针对文件的,即

将指定文件从一种编码转换为另一种编码。iconv函数族的头文件是iconv.h,使用前需包含之。      #include <iconv.h>

 iconv函数族有三个函数,原型如下:
     (1) iconv_t iconv_open(const char *tocode, const char *fromcode);
此函数说明将要进行哪两种编码的转换,tocode是目标编码,fromcode是原编码,该函数返回一个转换句柄,供以下两个函数使用。
     (2) size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t *outbytesleft);

此函数从inbuf中读取字符,转换后输出到outbuf中,inbytesleft用以记录还未转换的字符数,outbytesleft用以记录输出缓冲的

剩余空间。 转化失败,返回-1;

     (3) int iconv_close(iconv_t cd);

C代码示例:

#include <iconv.h>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>


#define OUTLEN 255
int Code_Convert(char *InStr,size_t InStrLen,const char *FromCode,char *OutStr,size_t OutStrLen,const char *ToCode)
{
iconv_t cd;
char **InArray = &InStr;
char **OutArray = &OutStr;

cd = iconv_open(ToCode,FromCode);
if(cd)
{
if(-1 == (int)iconv(cd,InArray,&InStrLen,OutArray,&OutStrLen))
{
return 1;
}
iconv_close(cd);
return 0;
}
return 1;
}


int main()
{
char *InStr = "我爱你,爱你死了";
char OutStr[OUTLEN];
size_t OutStrLen,InStrLen;

InStrLen = strlen(InStr);
OutStrLen = OUTLEN;

memset(OutStr,0,OutStrLen);
Code_Convert(InStr,InStrLen,"gb2312",OutStr,OutStrLen,"utf-8");

printf("gb2312-->unicode OutStr=%s\n",OutStr);
return 0;

}

编译:

gcc  -Wall  -o  test  test.c

运行:

./test

结果:

gb2312-->unicode OutStr=我爱你,爱你死了