【给数学不好的人的KMP】字符匹配教程(二)简化运算是为了什么如何移位

时间:2022-12-18 06:00:09

昨天我们花了那么长的时间,基本搞明白了next数组的作用。我们费尽全力,只为了把上文中的else条件进行更改,即:不更新i,只移动j,从而达到节省时间,把效率从O(mn)降到O(M+N)的水平。

为什么可以略过去的最大位移等于next对应的值呢?

举个例子:

s=abacaba

p=abab,有s[3]!=p[3],如果是BF的话:i=3-3+1=1,j=0;

但是我们可以发现一个规律,因p[0]≠p[1],s[1]=p[1],必有s[1]≠p[0],又因p0=p2,s2=p2,所以必有s2=p0。因此,第二次匹配可直接从i=3, j=1开始。 这就是next数组移位的原理。

下面给出一个能用的模板:

int KMP_Find(string s,string t,int pos) //pos从0开始,输出绝对位置要加1 
{
	build_next(t);
	int i=pos;
	int j=0;
	
	for(i=pos;i<s.size();i++)
	{
		while(j>0 && s[i]!=t[j])
		{
			j=next[j-1];
		}
		if(s[i]==t[j])
		{
			j++;
		}
		else
		{
			j=0;
		}
		if(j>=t.size())   //目标串匹配结束 
		{
			return i-t.size()+1;
		}
	}
		return -1;
	
}

kmp本身还有一些其他的形式,同样的,他的一个余数的性质可以用来求重复数等。与此衍生的还有bm算法等(不是剑圣。。)虽然只是搜索方向发生了改变,但本质却已经产生了极大的不同。下次再分解之。