C++读取mysql中utf8mb4编码表数据乱码问题及UTF8转GBK编码

数据库编码为utf8，但是由于某些表的一些字段存储了emoji字符，表采用了utf8mb4编码，默认情况下在C++代码中读出的中文字段值都变成了乱码。

解决方法为，在进行数据库查询前，在C++中执行一下“set names utf8”，例如在我的程序里执行下面的语句即可：

//不加这句话，中文乱码

mDS->executeNonQuery("set names utf8");

读出数据后，将字符转为本地编码即可，如GB2312，下面的函数实现将utf8编码的字符转为gbk编码：

//UTF_8 转gb2312

void  UTF_8ToGB2312(string &pOut, char *pText, int pLen)

{

    char buf[];

    char* rst = new char[pLen + (pLen >> ) + ];

    memset(buf,,);

    memset(rst,,pLen + (pLen >> ) + );

    int i =;

    int j = ;

    while(i < pLen)

    {

        if(*(pText + i) >= )

        {

            rst[j++] = pText[i++];

        }

        else

        {

            WCHAR Wtemp;

            UTF_8ToUnicode(&Wtemp,pText + i);

            UnicodeToGB2312(buf,Wtemp);

            unsigned short int tmp = ;

            tmp = rst[j] = buf[];

            tmp = rst[j+] = buf[];

            tmp = rst[j+] = buf[];

            //newBuf[j] = Ctemp[0];

            //newBuf[j + 1] = Ctemp[1];

            i += ;

            j += ;

        }

    }

    rst[j]='\0';

    pOut = rst;

    delete []rst;

}

void UnicodeToGB2312(char* pOut,WCHAR uData)

{

    WideCharToMultiByte(CP_ACP,NULL,&uData,,pOut,sizeof(WCHAR),NULL,NULL);

    return;

}

void UTF_8ToUnicode(WCHAR* pOut,char *pText)

{

    char* uchar = (char *)pOut;

    uchar[] = ((pText[] & 0x0F) << ) + ((pText[] >> ) & 0x0F);

    uchar[] = ((pText[] & 0x03) << ) + (pText[] & 0x3F);

    return;

}

读出数据后，要使用GDAL将数据写出到shp文件，同样也遇到了中文乱码问题。参照此处的文章，顺利解决，感谢原作者的分享。

秒客网

C++读取mysql中utf8mb4编码表数据乱码问题及UTF8转GBK编码

相关文章