昨天我们花了那么长的时间,基本搞明白了next数组的作用。我们费尽全力,只为了把上文中的else条件进行更改,即:不更新i,只移动j,从而达到节省时间,把效率从O(mn)降到O(M+N)的水平。
为什么可以略过去的最大位移等于next对应的值呢?
举个例子:
s=abacaba
p=abab,有s[3]!=p[3],如果是BF的话:i=3-3+1=1,j=0;
但是我们可以发现一个规律,因p[0]≠p[1],s[1]=p[1],必有s[1]≠p[0],又因p0=p2,s2=p2,所以必有s2=p0。因此,第二次匹配可直接从i=3, j=1开始。 这就是next数组移位的原理。
下面给出一个能用的模板:
int KMP_Find(string s,string t,int pos) //pos从0开始,输出绝对位置要加1 { build_next(t); int i=pos; int j=0; for(i=pos;i<s.size();i++) { while(j>0 && s[i]!=t[j]) { j=next[j-1]; } if(s[i]==t[j]) { j++; } else { j=0; } if(j>=t.size()) //目标串匹配结束 { return i-t.size()+1; } } return -1; }
kmp本身还有一些其他的形式,同样的,他的一个余数的性质可以用来求重复数等。与此衍生的还有bm算法等(不是剑圣。。)虽然只是搜索方向发生了改变,但本质却已经产生了极大的不同。下次再分解之。