【给数学不好的人的KMP】字符匹配教程(二)简化运算是为了什么如何移位

时间:2021-01-07 06:00:01

【给数学不好的人的KMP】字符匹配教程(二)简化运算是为了什么如何移位

676人阅读 评论(0) 收藏 举报
本文章已收录于:
【给数学不好的人的KMP】字符匹配教程(二)简化运算是为了什么如何移位分类:

昨天我们花了那么长的时间,基本搞明白了next数组的作用。我们费尽全力,只为了把上文中的else条件进行更改,即:不更新i,只移动j,从而达到节省时间,把效率从O(mn)降到O(M+N)的水平。

为什么可以略过去的最大位移等于next对应的值呢?

举个例子:

s=abacaba

p=abab,有s[3]!=p[3],如果是BF的话:i=3-3+1=1,j=0;

但是我们可以发现一个规律,因p[0]≠p[1],s[1]=p[1],必有s[1]≠p[0],又因p0=p2,s2=p2,所以必有s2=p0。因此,第二次匹配可直接从i=3, j=1开始。 这就是next数组移位的原理。

下面给出一个能用的模板:

  1. int KMP_Find(string s,string t,int pos) //pos从0开始,输出绝对位置要加1   
  2. {  
  3.     build_next(t);  
  4.     int i=pos;  
  5.     int j=0;  
  6.       
  7.     for(i=pos;i<s.size();i++)  
  8.     {  
  9.         while(j>0 && s[i]!=t[j])  
  10.         {  
  11.             j=next[j-1];  
  12.         }  
  13.         if(s[i]==t[j])  
  14.         {  
  15.             j++;  
  16.         }  
  17.         else  
  18.         {  
  19.             j=0;  
  20.         }  
  21.         if(j>=t.size())   //目标串匹配结束   
  22.         {  
  23.             return i-t.size()+1;  
  24.         }  
  25.     }  
  26.         return -1;  
  27.       
  28. }  

kmp本身还有一些其他的形式,同样的,他的一个余数的性质可以用来求重复数等。与此衍生的还有bm算法等(不是剑圣。。)虽然只是搜索方向发生了改变,但本质却已经产生了极大的不同。下次再分解之。


我的同类文章