处理文本经常用到正则表达式,boost库也提供了正则表达式的支持。
boost::regex re("abc", boost::regex::icase | boost::regex::normal);
// code snippet
#include<boost/regex.hpp>
...
boost::regex re("//d{4}");
std::string str = "1234";
if(boost::regex_match(str, re)) {
std::cout<<"OK";
}
regex_match用于完全匹配, regex_search只要求部分数据匹配。
boost::regex_search("123456", re); // true
匹配的结果保存在match_results中,有2种match_results
一种是cmatch, 处理const char*
一种是smatch, 处理std::string
boost::smatch m;
if(boost::regex_search(str, m, re)) {
if(m[0].matched) {
std::cout<<m[0]<<std::endl;
std::cout<<m[0].str();
}
}
分割字符串regex_token_iterator
boost::regex re(",");
std::string str="abc,cd,e";
boost::sregex_token_iterator it(s.begin(), s.end(), re, -1);
boost::sregex_token_iterator end;
while(it!=end)
std::cout<<*it++<<std::endl;
一个分割字符串的函数:
vector<string> *split(string &str, boost::regex &re) {
vector<string> *v = new vector<string>();
boost::sregex_token_iterator it(str.begin(), str.end(), re, -1);
boost::sregex_token_iterator end;
while(it!=end) {
v->push_back(*it++);
}
return v;
}