KMP算法中的next函数

时间:2021-04-12 18:51:47

原文链接:http://blog.csdn.net/joylnwang/article/details/6778316/

其实后面大段的代码都可以不看

KMP的关键是next的产生

这里使用了中间变量f

 

下面是原文

"""

这里我们引入一个概念f(j),其含义是,对于模式串的第j个字符pattern[j],f(j)是所有满足使pattern[1...k-1] = pattern[j-(k-1)...j - 1](k < j)成立的k的最大值。还是以模式串abcabcacab为例,当处理到pattern[8] = 'c'时,我们想找到'c'前面的k-1个字符,使得pattern[1...k-1] = pattern[8-(k-1)...7],这里我们可以使用一个笨法,让k-1从1到6递增,然后依次比较,直到找到最大值的k为止,比较过程如下

 

k-1 前缀 关系 子串
1 a == a
2 ab != ca
3 abc != bca
4 abca == abca
5 abcab != cabca
6 abcabc != bcabca

因为要取最大的k,所以k-1=1不是我们要找的结果,最后求出k的最大值为4+1=5。但是这样的方法比较低效,而且没有充分利用到之前的计算结果。在我们处理pattern[8] = 'c'之前,pattern[7] = 'a'的最大前缀包含问题已经解决,f(7) = 4,也就是说,pattern[4...6] = pattern[1...3],此时我们可以比较pattern[7]与pattern[4],如果pattern[4]=pattern[7],对于pattern[8]而言,说明pattern[1...4]=pattern[4...7],此时,f(8) = f(7) + 1 = 5。再以pattern[9]为例,f(8) = 5,pattern[1...4]=pattern[4...7],但是pattern[8] != pattern[5],所以pattern[1...5]!=pattern[4...8],此时无法利用f(8)的值直接计算出f(9)。

"""

 

如此 通过f(n-1)推导f(n)已经成功了一半

我们已经知道了当pattern(n-1)==pattern(f(n-1))的情况下f(n)=f(n-1)+1

那么左边!=右边的情况下呢?

 

原文中先介绍了next的求法

next很好求 当pattern(n) != pattern(f(n))时 next(n)=f(n)

当左边等于右边时考虑pattern(n)是否等于pattern(f(f(n))) 如此一直递归直到不等即可 看起来很多括号可能有点晕,但是仔细思考一下next函数的意义就能很轻松的得到它与f函数的关系了

那么继续上面的内容 通过f(n-1)推导f(n) 的剩下一半该怎么解决

当左边!=右边时,我们求出通过刚才了解到的方法求出next(n-1)

以下是原文

"""

当要求f(9)时,f(8)和next[8]已经可以得到,此时我们可以考察pattern[next[8]],根据前面对于next值的计算方式,我们知道pattern[8] != pattern[next[8]]。我们的目的是要找到pattern[9]的包含前缀,而pattern[8] != pattern[5],pattern[1...5]!=pattern[4...8]。我们继续考察pattern[next[5]]。如果pattern[8] = pattern[next[5]],假设next[5] = 3,说明pattern[1...2] = pattern[6...7],且pattern[3] = pattern[8],此时对于pattern[9]而言,就有pattern[1...3]=pattern[6...8],我们就找到了f(9) = 4。这里我们考察的是pattern[next[j]],而不是pattern[f(j)],这是因为对于next[]而言,pattern[j] != pattern[next[j]],而对于f()而言,pattern[j]与pattern[f(j)]不一定不相等,而我们的目的就是要在pattern[j] != pattern[f(j)]的情况下,解决f(j+1)的问题,所以使用next[j]向前回溯,是正确的。

"""

 

如果有耐心认真看完上面那一段很绕的话那么其实解决方法已经很明显了

就是通过递归找出pattern(x)==pattern(n-1)其中x=next(next(next(n-1)))  (这里next并不是一定是三层 只是打个比方 一直递归下去直到找到第一个pattern值等于pattern(n-1))的为止