原文地址: http://moilk.org/blog/2016/09/09/ccf2016043/
问题描述
在操作系统中,数据通常以文件的形式存储在文件系统中。文件系统一般采用层次化的组织形式,由目录(或者文件夹)和文件构成,形成一棵树的形状。文件有内容,用于存储数据。目录是容器,可包含文件或其他目录。同一个目录下的所有文件和目录的名字各不相同,不同目录下可以有名字相同的文件或目录。
为了指定文件系统中的某个文件,需要用路径来定位。在类 Unix 系统(Linux、Max OS X、FreeBSD等)中,路径由若*分构成,每个部分是一个目录或者文件的名字,相邻两个部分之间用 / 符号分隔。
有一个特殊的目录被称为根目录,是整个文件系统形成的这棵树的根节点,用一个单独的 / 符号表示。在操作系统中,有当前目录的概念,表示用户目前正在工作的目录。根据出发点可以把路径分为两类:
* 绝对路径:以 / 符号开头,表示从根目录开始构建的路径。
*Ÿ 相对路径:不以 / 符号开头,表示从当前目录开始构建的路径。
例如,有一个文件系统的结构如下图所示。在这个文件系统中,有根目录 / 和其他普通目录 d1、d2、d3、d4,以及文件 f1、f2、f3、f1、f4。其中,两个 f1 是同名文件,但在不同的目录下。
对于 d4 目录下的 f1 文件,可以用绝对路径 /d2/d4/f1 来指定。如果当前目录是 /d2/d3,这个文件也可以用相对路径 ../d4/f1 来指定,这里 .. 表示上一级目录(注意,根目录的上一级目录是它本身)。还有 . 表示本目录,例如 /d1/./f1 指定的就是 /d1/f1。注意,如果有多个连续的 / 出现,其效果等同于一个 /,例如 /d1///f1 指定的也是 /d1/f1。
本题会给出一些路径,要求对于每个路径,给出正规化以后的形式。一个路径经过正规化操作后,其指定的文件不变,但是会变成一个不包含 . 和 .. 的绝对路径,且不包含连续多个 / 符号。如果一个路径以 / 结尾,那么它代表的一定是一个目录,正规化操作要去掉结尾的 /。若这个路径代表根目录,则正规化操作的结果是 /。若路径为空字符串,则正规化操作的结果是当前目录。
输入格式
第一行包含一个整数 P,表示需要进行正规化操作的路径个数。
第二行包含一个字符串,表示当前目录。
以下 P 行,每行包含一个字符串,表示需要进行正规化操作的路径。
输出格式
共 P 行,每行一个字符串,表示经过正规化操作后的路径,顺序与输入对应。
样例输入
7
/d2/d3
/d2/d4/f1
../d4/f1
/d1/./f1
/d1///f1
/d1/
///
/d1/../../d2
样例输出
/d2/d4/f1
/d2/d4/f1
/d1/f1
/d1/f1
/d1
/
/d2
评测用例规模与约定
1 ≤ P ≤ 10。
文件和目录的名字只包含大小写字母、数字和小数点 .、减号 - 以及下划线 _。
不会有文件或目录的名字是 . 或 .. ,它们具有题目描述中给出的特殊含义。
输入的所有路径每个长度不超过 1000 个字符。
输入的当前目录保证是一个经过正规化操作后的路径。
对于前 30% 的测试用例,需要正规化的路径的组成部分不包含 . 和 .. 。
对于前 60% 的测试用例,需要正规化的路径都是绝对路径。
解题说明
这道题要讲究操作的顺序。首先,如果字符串的第一个字符不是’/’, 就不管别的先把当前目录方在前面, 这样所有字符串就都变成了绝对路径。然后再把中间所有多余的’/’去掉,末尾的保留。如果末尾没有’/’, 其实加上会比较好, 这样可以发现如果末尾是当前目录或者上级目录,操作变得方便多了。接着,所有的当前目录符号都是多余的,全部去掉,这时要注意搜索的是”/./”, 因为目录或者文件名可以包含’.’。做到这一步就发现只剩下上级目录符号了, 我想不用我再多说也知道该怎么办了。最后去掉末尾的’/’, 就全部搞定了(注意,如果之前末尾没有自己追加一个’/’,这时还要额外考虑末尾是”/..”和”/.”的情况, 我下面给的代码就是这样, 写到这里的时候才发现可以追加斜杠变得简单)。
#include <iostream>
using namespace std;
string str[10];
string::size_type refind(const string &str,string::size_type pos,const char c) {
int p=pos;
while(1) {
if(p==-1) {
return (string::npos);
}
if(str[p]==c) {
return p;
}
p--;
}
return (string::npos);
}
int main(void) {
int N;
string pwd,pwdf,tmp;
cin>>N;
cin>>pwd;
getchar();
string::size_type pre=0;
string::size_type post;
while(1) {
post=pwd.find('/',pre+1);
if(post==string::npos) {
break;
}
pre=post;
}
if(pre==0) {
pwdf="/";
} else {
pwdf=pwd.substr(0,pre);
}
for(int i=0; i<N; i++) {
getline(cin,tmp);
// 头部的处理
if(tmp[0]!='/') {
tmp=pwd+"/"+tmp;
}
// 去掉多于斜杠
pre=0;
while(1) {
post=tmp.find('/',pre);
if(post==string::npos) {
break;
}
pre=post+1;
post++;
while(1) {
if(post>=tmp.size()||tmp[post]!='/') {
break;
}
post++;
}
tmp.erase(pre,post-pre);
}
// 去掉中间的单点
pre=0;
while(1) {
post=tmp.find("/./",pre);
if(post==string::npos) {
break;
}
tmp.erase(post+1,2);
pre=post;
}
// 去掉中间的双点
pre=0;
while(1) {
post=tmp.find("/../",pre);
if(post==string::npos) {
break;
}
pre=refind(tmp,post-1,'/');
if(pre!=string::npos) {
pre++;
} else {
pre=post+1;
}
tmp.erase(pre,post+4-pre);
pre--;
}
//去掉末尾的点
int len=tmp.size();
if(len>=2&&tmp[len-1]=='.'&&tmp[len-2]=='/') {
tmp.erase(len-1,1);
}
len=tmp.size();
if(len>=3&&tmp[len-1]=='.'&&tmp[len-2]=='.'&&tmp[len-3]=='/') {
pre=refind(tmp,len-4,'/');
if(pre!=string::npos) {
pre++;
} else {
pre=len-2;
}
tmp.erase(pre,len);
}
// 去掉末尾的斜杠
len=tmp.size();
if(len>1&&tmp[len-1]=='/') {
tmp.erase(len-1,1);
}
cout<<tmp<<endl;
}
return 0;
}