在C++11之后,std标准库引入正则表达式的功能,这个功能是比较常用的,因为对模式的匹配和识别,是一项经常需要运用的功能。比如在处理银行的一些数据文件,这些文件名称都是有一定的规律组成的,如果不使用正则表达式,怎么样来判断这些文件名称是否合法的数据文件?一般开发人员,就会一个字符一个字符地判断,是否符合相应的规则。如果使用正则表达式,就自己代码来得快速和灵活。比如有一批文件,它们的名称是这样命名的:
1000001_v2000.csv
前面一串1000001是数字,接着是下划线,紧接是版本号v2000,后面.csv是文件名称后缀。针对这个格式,可以使用C++ 11里的正则表达式来判断,代码如下:
#include "stdafx.h" #include <string> #include <regex> #include <iostream> int main() { std::wstring strTest = L"1000001_v2000.csv"; std::wsmatch wm; std::wregex wrx(L"(\\d+)_v(\\d+)\\.csv"); if (std::regex_match(strTest, wm, wrx)) { for (auto it : wm) std::wcout << it.str().c_str() << std::endl; } return 0; }
输出结果如下:
1000001_v2000.csv
1000001
2000
从结果里,就很轻松拿到前一串的序号,以及后面的文件的版本号,这样处理起来就很轻松了。如果不符这种规则的文件名称,就不会匹配成功。