ifstream中文路径问题分析

时间:2021-10-08 18:34:48

最近维护一个项目,遇到了ifstream在中文路径下打开文件失败的bug,我搜索了一下,最后整理成下文以后日后查阅。

一、问题重现

  1. vs2008下创建一个简单win32工程。
  2. 使用ANSI编码方式:项目属性页 ->配置属性 ->常规 ->项目默认值 ->字符集中选择"使用多字节字符集"。
  3. 简单出错代码:
    #include "stdafx.h"
    #include <Windows.h>
    #include <fstream> int _tmain(int argc, _TCHAR* argv[])
    {
    std::ifstream infofile;
    infofile.open(_T("D:\\测试\\test.cpp"));
    if (infofile.is_open())
    {
    printf("Open success!!!\r\n");
    }
    else
    {
    printf("Open fail error code:%d\r\n", GetLastError());
    }
    return 0;
    }

  4. 运行输出结果:Open fail error code:3。
  5. GetLastError()错误代码:3   系统找不到指定的路径; 而选择“使用 Unicode 字符集”时则无此问题出现;说明 是字符编码的问题,ifstream的open方法对传进入的中文窄字符处理可能存在问题。

二、原因分析

  1. 跟进ifstream的open方法可以发现,在其内部是用mbstowcs_s来实现窄字符转化成宽字符的。
  2. msdn:mbstowcs_s uses the current locale for any locale-dependent behavior (mbstowcs_s的调用结果依赖于程序的本地化设置)。
  3. 本地化设置可以通过setlocale函数来设置,例如:setlocale(LC_ALL, "chinese")表示将程序本身的语言设置为中文,而程序启动时默认设置为LC_ALL="C"。
  4. 在使用mbstowcs_s进行字符串转换时,只有当LC_ALL="chinese"时,含中文的字符串才能正确的转换成其对应的宽字节字符,否则(在LC_ALL="C"时),汉字会被看成2个单字节的字符,然后再转换成宽字节的字符,这样转换的结果显然是错误的!
  5. 这就是ifstream打开含中文路径的文件失败的原因,因为"D:\\测试\\test.cpp"转换后得到错误的路径,所以找不到指定路径!

三、解决方法

  1. 最好的方法就是使用“使用 Unicode 字符集”,因为不但可以避免此类问题,而且也提升的程序执行效率(系统底层都是使用宽字节的 window 核心程序有说)
  2. 如果是历史项目不方便大改的话,可以有以下两种方法实现,展示代码如下:
    	std::ifstream infofile;
    // 方法1,使用STL中的locale类的静态方法指定全局locale
    std::locale::global(std::locale("")); //将全局区域设为操作系统默认区域
    infofile.open("D:\\测试\\test.cpp"); //可以顺利打开文件了
    std::locale::global(std::locale("C")); //还原全局区域设定 // 方法2,使用C函数setlocale
    TCHAR* ptOldLocale = _tcsdup(_tsetlocale(LC_CTYPE, NULL)); //获取本地语言保存
    _tsetlocale(LC_CTYPE, _T("")); //C语言的全局locale设置为本地语言,但这会导致cout和wcout不能输出中文
    infofile.open("D:\\测试\\test.cpp"); //可以顺利打开文件了
    _tsetlocale(LC_CTYPE, ptOldLocale); //将C语言的全局locale恢复