zz CHAR, TCHAR, WCHAR_T .. ANSI&Unicode [修改]

一．ANSI和UNICODE

ANSI字符和Unicode字符
       ANSI字符类型为CHAR，指向字符串的指针PSTR(LPSTR),指向一个常数字符串的指针PCSTR(LPCSTR)；对应的Windows定义的Unicode字符类型为WCHAR（typedef WCHAR wchar_t），指向Unicode字符串的指针PWSTR ，指向一个常数Unicode字符串的指针PCWSTR 。

                                   ANSI “ANSI”
                                   Unicode L“UNICODE”
                                   ANSI/Unicode T(“string”)或_TEXT(“string”)

ANSI字符和Unicode字符串的操作

       双字节(DBCS)字符集中，字符串的每个字符可以包含一个或两个字节。如果只是调用strlen()函数，那么你就无法知道字符串到底有多少个字符，它只能告诉你到达结尾的0之前有多少个字节。标准c中的strcpy,strchr,strcat等只能用于ANSI字符串，不能正确处理Unicode字符串，因此也提供了一组补充函数，功能等价，但用于Unicode码。我们来看看string .h字符串头文件中是怎样处理char*和wchar_t*两个字符串版本的：
                                   char *strcat(char*,const char*);
                                   wchar_t *wcscat(wchat_t*,const wchar_t *)

类似的还有strchr/wcschr，strcmp/wcscmp，strlen/wcslen etc.
                                   ANSI 操作函数以str开头 strcpy
                                   Unicode 操作函数以wcs开头 wcscpy
                                   MBCS 操作函数以_mbs开头 _mbscpy
                                   ANSI/Unicode 操作函数以_tcs开头 _tcscpy（C运行期库）
                                   ANSI/Unicode 操作函数以lstr开头 lstrcpy（Windows函数）

二．ANSI/UNICODE通用字符/字符串类型TCHAR/LPTSTR/LPCTSTR

Neutral ANSI/UNICODE types

1．通用字符型TCHAR

TCHAR

                ifdef UNICODE it   is   wchar_t（WCHAR）for Unicode platforms;

                else it   is   char for   ANSI   and DBCS   platforms.

2．通用字符串指针LPTSTR

LPTSTR

                ifdef UNICODE it is LPWSTR（*wchar_t） for Unicode platforms;

                else it is LPSTR (*char) for ANSI   and DBCS   platforms.

3．通用通用常数字符串指针LPCTSTR

LPCTSTR

                ifdef UNICODE it   is   LPCWSTR(*const wchar_t) for   Unicode   platforms;

                else it   is LPCSTR (*const char)for   ANSI   and   DBCS   platforms.



typedef LPWSTR LP;

               #define __TEXT(quote) L##quote      // r_winnt

<1>_UNICODE宏用于C运行期头文件，UNICODE宏则用于Windows头文件,当编译代码模块时，通常必须同时定义这两个宏。

<2>如果定义了_UNICODE，若要生成一个Unicode字符串,字符串前要加L宏，用于告诉编译器该字符串应该作为Unicode字符串来编译处理。但是这样又有个问题就是如果没有定义_UNICODE则编译出错。为了解决这个问题我们必须用到_TEXT宏，这个宏也在TChar.h中做了定义。使用该宏后，无论源文件有没有定义_UNICODE都不会出现编译错误。

<3>Unicode与ANSI字符串的转换：Windows函数MultiByteToWideChar函数用于将多字节字符串转换成宽字符串,函数WideCharToMultiByte将宽字符串转换成等价的多字节字符串。

       另外,有的人爱用strcpy等标准ANSI函数，有的人爱用_tXXXX函数，有必要把来龙去脉搞清楚。为了搞清这些函数，就必须理请几种字符类型的写法。char就不用说了，先说一些wchar_t。wchar_t是Unicode字符的数据类型，它实际定义在<string.h>里：
typedef unsigned short wchar_t;
       不能使用类似strcpy这样的ANSI C字符串函数来处理wchar_t字符串，必须使用wcs前缀的函数，例如wcscpy。为了让编译器识别Unicode字符串，必须以在前面加一个“L”,例如:
                wchar_t *szTest=L"This is a Unicode string."

       下面在看看TCHAR。如果你希望同时为ANSI和Unicode编译的源代码，那就要include TChar.h。TCHAR是定义在其中的一个宏，它视你是否定义了_UNICODE宏而定义成char或者wchar_t。如果你使用了TCHAR，那么就不应该使用ANSI的strXXX函数或者Unicode的wcsXXX函数了，而必须使用TChar.h中定义的_tcsXXX函数。另外，为了解决刚才提到带“L”的问题，TChar.h中定义了一个宏：“_TEXT”。
以strcpy函数为例子，总结一下:
.                如果你想使用ANSI字符串，那么请使用这一套写法：
                char szString[100];
                strcpy(szString,"test");

                .如果你想使用Unicode字符串，那么请使用这一套：
                wchar_t szString[100];
                wcscpy(szString,L"test");

                .如果你想通过定义_UNICODE宏，而编译ANSI或者Unicode字符串代码：
                TCHAR szString[100];
                _tcscpy(szString,_TEXT("test"));

ANSI与Unicode
Unicode称为宽字符型字串,COM里使用的都是Unicode字符串。
将ANSI转换到Unicode
(1)通过L这个宏来实现，例如: CLSIDFromProgID( L"MAPI.Folder",&clsid);
(2)通过MultiByteToWideChar函数实现转换,例如:
                char *szProgID = "MAPI.Folder";
                WCHAR szWideProgID[128];
                CLSID clsid;
                long lLen = MultiByteToWideChar(CP_ACP,0,szProgID,strlen(szProgID),szWideProgID,sizeof(szWideProgID));
                szWideProgID[lLen] = '\0’;
(3)通过A2W宏来实现,例如:
                USES_CONVERSION;
                CLSIDFromProgID( A2W(szProgID),&clsid);
                将Unicode转换到ANSI
(1)使用WideCharToMultiByte,例如:
// 假设已经有了一个Unicode 串 wszSomeString...
                char szANSIString [MAX_PATH];
                WideCharToMultiByte ( CP_ACP, WC_COMPOSITECHECK, wszSomeString, -1, szANSIString, sizeof(szANSIString), NULL, NULL );

(2)使用W2A宏来实现,例如:
                USES_CONVERSION;
                pTemp=W2A(wszSomeString);

本文来自CSDN博客：http://blog.csdn.net/dongyonghui_1017/archive/2009/06/18/4280205.aspx

char*、TCHAR*转换CString
CString str(****)
下面详细写一下其它转换
***********************************************************************
* 函数： TransCStringToTCHAR
* 描述：将CString 转换为 TCHAR*
* 日期：
***********************************************************************
TCHAR* CPublic::CString2TCHAR(CString &str)
{
int iLen = str.GetLength();
TCHAR* szRs = new TCHAR[iLen];
lstrcpy(szRs, str.GetBuffer(iLen));
str.ReleaseBuffer();
return szRs;
}

***********************************************************************
* 函数： THCAR2Char
* 描述：将TCHAR* 转换为 char*
***********************************************************************
char* CPublic::THCAR2char(TCHAR* tchStr)
{
int iLen = 2*wcslen(tchStr);//CString,TCHAR汉字算一个字符，因此不用普通计算长度
char* chRtn = new char[iLen+1]
wcstombs(chRtn,tchStr,iLen+1);//转换成功返回为非负值
return chRtn;
}

***********************************************************************
* 函数： CString2char
* 描述：将CString转换为 char*
***********************************************************************
char* CPublic::CString2char(CString &str)
{
int len = str.GetLength();
char* chRtn = (char*)malloc((len*2+1)*sizeof(char));//CString的长度中汉字算一个长度
memset(chRtn, 0, 2*len+1);
USES_CONVERSION;
strcpy((LPSTR)chRtn,OLE2A(str.LockBuffer()));
return chRtn;
}
***********************************************************************
* 函数名：GetAnsiString
* 描述：将CString（unicode）转换为char*(ANSI)
* 参数：CString &s 要转换的CString
* 返回值：返回转换结果
***********************************************************************
char* GetAnsiString(const CString &s)
{
int nSize = 2*s.GetLength();
char *pAnsiString = new char[nSize+1];
wcstombs(pAnsiString, s, nSize+1);
return pAnsiString;
}

秒客网

zz CHAR, TCHAR, WCHAR_T .. ANSI&Unicode [修改]

相关文章