这两天呢,一直在被小伙伴们快ak的恐惧支配,G题杭电的数据很水,但是自己还是选择不水过,用扩展kmp去写,网上的资料很多,自己选了一个最简洁的模板,不用再写一个求next数组的函数,直接调用前特殊处理下exkmp函数就既可以求next数组,又可以求ex数组啦,hh谁说鱼与熊掌不可兼得,这不就是吗~但是呢,一开始一点也不好理解哎,自己选的模板,跪着也得理解完~~~(泪目~~
————言归正传,总结——————
1.扩展kmp算法呢是对kmp算法的扩展,扩展kmp算法也有一个和kmp函数名字一样的next数组,还有一个ex数组。
2.扩展kmp算法的可以用o(m+n)的复杂度求出字符串s1任意后缀和字符串s2的最长公共前缀。
3:扩展kmp算法里ex数组:ex[i] == j表示s1以i为起始的后缀与s2的最长公共前缀。
扩展kmp算法里next数组:next[i] == j表示s2以i为起始的后缀与s2的最长公共前缀
两者作用都一样当然可以调用同一个函数咯~
kmp算法里next数组:next[i] == j表示s2在0~i之前已匹配的前缀后缀长度为j+1(前提是next[0]初始化为-1,如果初始化为0,已匹配的长度就为j)
————加深理解,模拟算法实现过程————
用样例s1=aaaabaa,s2=aaaaa直接进行模拟算法实现过程,前提是要结合模板
第一步:由于exkmp函数的作用是在已知s2的next数组的情况下,求出字符串s1的任意后缀与字符串s2的最长公共前缀,存入ex,所以我们需要先调用函数求出next数组
主函数里调用过程如下,预先初始化next[0]=0;
exkmp(s2+1,s2,next+1,next);
这样调用的原因参见总结3,生成next数组的过程相当于将s2与s2自身进行匹配,s2+1 == 形参s1
s2 == 形参s2
next+1 == 形参ex
next == 形参next.
接收过程如下:
void exkmp(char s1[],char s2[],int ex[],int next[])
a.在此函数中我们传递给形参s1的是s2+1,结合下图所示样例s1=aaaa,s2=aaaaa来看,即s1[0..] == (s2+1)[1..]
b.传递给形参ex的是next+1,也就是next数组后移一位,即ex[i] == next[i+1](有点难懂,解释下,
我们将形参s1和形参s2进行匹配时,实际就是实参数组s2[1...]的后缀与实参数组本身s2[0..]的前缀进行匹配,所以我们匹配出的最大公共长度min(next[j],p)赋值给形参数组ex[i]时,实际就是赋值给next[i+1],(这里不知道为什么取最小值不要紧,稍后进行解释),结合下图两张图片
e[1] = 3 e[2] = 2 e[3] = 1
next[2] = 3 next[3] = 2 next[4] = 1
/*主函数里初始化和调用*/
/*next[0] = 0;
exkmp(s2+1,s2,next+1,next);
exkmp(s1,s2,ex,next);*/
void exkmp(char s1[],char s2[],int ex[],int next[])
{
int i,j,p;
i = j = 0;
p = -1;
while(s1[i]!='\0')
{
if( p == -1)
{
j = 0;
do
p++;
while(s1[i+p] != '\0'&&s1[i+p] == s2[j+p]);
ex[i] = p;
}
else if(next[j] < p)
ex[i] = next[j];
else if(next[j] > p)
ex[i] = p;
else
{
j = 0;
while(s1[i+p] != '\0'&&s1[i+p] == s2[j+p])
p++;
ex[i] = p;
}
i++;
j++;
p--;
}
ex[i] = 0;
return;
}