KMPnext数组自看

next[i]表示去掉第i个元素后，自已的前缀和后缀完全匹配的最大长度

例

字符串　　  a b a b a b z a b a b a b a

next　　  -1 0 0 1 2 3 4 0 1 2 3 4 5 6 0

前缀和后缀是啥意思呢
例
abababz    前缀有 a   ab   aba   abab   ababa   ababab  不算最后一个
　　　　　　后缀有 z   bz   abz   babz   ababz    bababz 不算第一个

void getNext()

{

    int j, k;

    j = ; k = -; next[] = -;

    while(j < tlen)

        if(k == - || T[j] == T[k])

            next[++j] = ++k;

        else

            k = next[k];

}

根据代码一个个匹配就好了

关键在于next的回溯为什么要这样回溯

我们再看 字符串　 a b a b a b z a b a b a b a

每一个最长长度有两种来源 1、如果当前字符匹配则由上一个最长长度加一 2、如果不匹配则看次长长度的下一个字符是否与当前字符匹配。。不匹配就看次次长长度。。以此类推

为什么呢。。。因为我们想要得到到当前位置的最长匹配长度。。

那为什么k = next[k]就能到次长长度的下一个位置呢。。

我们就看上边那个个字符串 z的下标为6 next[6] = 4表示去掉位置6的字符后所能匹配的最大长度

那么这个长度4是由上一个位置推出来的

那么上一个位置是不是就是当前位置的次长长度

既然是上一个位置为什么不是k = j - 1而是k = next[k]呢

因为j代表后缀的位置而k是前缀的位置因为是找一个次大的前缀来匹配当前后缀

而next[k]是除去k之后的最大匹配长度即下标k前的最大匹配长度(当然一定到k-1)

其实意思很好懂。。。。记得平行吗。。a//b b//c a//c

那next[k]不就是能和j匹配的前缀的位置吗。。。

所以这个长度就是

匹配就和人情世故一样。。。能通融一下通融一下。。。大的不行那就次大。。次大不行。。。那就次次大。。嗯。。就是这样。。kmp就是遵循了这个法则。。是的。。

bin神kmp模板

/*

pku3461(Oulipo), hdu1711(Number Sequence)

这个模板 字符串是从0开始的

Next数组是从1开始的

*/

#include <iostream>

#include <cstring>

using namespace std;

const int N = ;

int next[N];

char S[N], T[N];

int slen, tlen;

void getNext()

{

    int j, k;

    j = ; k = -; next[] = -;

    while(j < tlen)

        if(k == - || T[j] == T[k])

            next[++j] = ++k;

        else

            k = next[k];

}

/*

返回模式串T在主串S中首次出现的位置

返回的位置是从0开始的。

*/

int KMP_Index()

{

    int i = , j = ;

    getNext();

    while(i < slen && j < tlen)

    {

        if(j == - || S[i] == T[j])

        {

            i++; j++;

        }

        else

            j = next[j];

    }

    if(j == tlen)

        return i - tlen;

    else

        return -;

}

/*

返回模式串在主串S中出现的次数

*/

int KMP_Count()

{

    int ans = ;

    int i, j = ;

    if(slen ==  && tlen == )

    {

        if(S[] == T[])

            return ;

        else

            return ;

    }

    getNext();

    for(i = ; i < slen; i++)

    {

        while(j >  && S[i] != T[j])

            j = next[j];

        if(S[i] == T[j])

            j++;

        if(j == tlen)

        {

            ans++;

            j = next[j];

        }

    }

    return ans;

}

int main()

{

    int TT;

    int i, cc;

    cin>>TT;

    while(TT--)

    {

        cin>>S>>T;

        slen = strlen(S);

        tlen = strlen(T);

        cout<<"模式串T在主串S中首次出现的位置是: "<<KMP_Index()<<endl;

        cout<<"模式串T在主串S中出现的次数为: "<<KMP_Count()<<endl;

    }

    return ;

}

/*

test case

aaaaaa a

abcd d

aabaa b

*/

秒客网

KMPnext数组自看

相关文章