同一份源代码,源文件编码格式为UTF-8:
string tmp = "我"; for(int i=0;i<tmp.size();++i) { printf("%0x ",tmp[i]); }
在MSVC编译器下输出
ffffffce ffffffd2
在MingW编译器下输出
ffffffe6 ffffff88 ffffff91
很明显,MSVC对中文采用GB2312或GBK编码,即使用两个字节表示汉字
而MingW对中文采用UTF-8编码,即使用三个字节存储汉字。
另外注意的是:
源文件采取何种编码方式只影响编译器的解析过程,而不会影响解析完毕后的编译过程。
Windows的终端在打印GB2312或GBK编码的中文时显示正确;而打印UTF-8编码的中文时会乱码。