[置顶] 字符编码转换libiconv库

时间:2023-01-10 22:08:46

    当前流行的字符编码格式有:US-ASCII、ISO-8859-1、UTF-8、UTF-16BE、UTF-16LE、UTF-16、GBK、GB2312等,其中GBK、GB2312是专门处理中文编码的。而libiconv是一个常用的编码转换库,支持常用的多种编码之间的转换。在Linux下,工具链gcc有专门的libiconv库,所有不用移植,但在arm-linux下就没那么幸运了,需要我们额外移植libiconv库,不过,过程还是比较简单的。

 

一、字符编码转换libiconv库介绍

    libiconv是一个常用的编码转换库,支持常用的多种编码之间的转换。主要函数有:

    #include <iconv.h>

    iconv_ticonv_open(constchar *tocode,  const char *fromcode);

    size_ticonv(iconv_t cd,  char **inbuf,  size_t *inbytesleft,  char **outbuf,  size_t *outbytesleft);

    int iconv_close(iconv_tcd);

    iconv_open是打开一个编码流,类似于打开一个编码管道(通道),出错则返回-1;

    iconv用于具体输入的转换,如果出错,则返回 -1,否则返回 0;

    iconv_close是关闭该管道(通道)。

    如果对于大量需要转换的编码,上述函数covert不适合该方式,一是内存的限制不能一次调用,二是若分多次调用会频繁打开一个编码管道(通道),导致资源浪费,最好的办法还是拆开该函数根据情况使用。   

 

二、arm-linux移植过程

    1)http://www.gnu.org/software/libiconv/ 下载 libiconv-1.14.tar.gz

    2)./configure CC=arm-hismall-linux-gcc --target=arm-linux--host=arm-hismall-linux --prefix=/usr/local/iconv --enable-shared--enable-static

    3) make   

    4) make install

 

三、实例unicode.cpp

//#include <iconv.h>
#include <iostream>
#include <string.h>
#include "./iconv.h"
using namespace std;

// 代码转换操作类
class CodeConverter {
private:
iconv_t cd;

public:
// 构造
CodeConverter(const char *from_charset, const char *to_charset)
{
cd = iconv_open(to_charset, from_charset);
}

// 析构
~CodeConverter()
{
iconv_close(cd);
}

// 转换输出
int convert(char *inbuf, int inlen, char *outbuf, int outlen)
{
char **pin = &inbuf;
char **pout = &outbuf;

memset(outbuf, 0, outlen);
return iconv(cd, pin, (size_t *)&inlen, pout, (size_t *)&outlen);
}
};

int main(int argc, char **argv)
{
char *gb2312 = "我是中国人";
char out0[256] = {0};
char out1[256] = {0};

// gb2312-->utf-8
CodeConverter cc0 = CodeConverter("gb2312","utf-8");
cc0.convert(gb2312, strlen(gb2312)+1, out0, 256);
cout << "gb2312-->utf-8 in=" << gb2312 << ",out0=" << out0 << endl;

// utf-8-->gb2312
CodeConverter cc1 = CodeConverter("utf-8", "gb2312");
cc1.convert(out0, strlen(out0)+1, out1, 256);
cout << "utf-8-->gb2312 in=" << out0 << ",out1=" << out1 << endl;

return 0;
}

    arm-hismall-linux-g++ unicode.cpp -L./-liconv  //静态库然后nfs下载到板子上或直接运行就ok了。