hdu_3068 最长回文(Manacher算法)

时间:2022-06-22 02:15:41

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3068

最长回文

Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 15922    Accepted Submission(s): 5830

Problem Description
给出一个只由小写英文字符a,b,c...y,z组成的字符串S,求S中最长回文串的长度.
回文就是正反读都是一样的字符串,如aba, abba等
Input
输入有多组case,不超过120组,每组输入为一行小写英文字符a,b,c...y,z组成的字符串S
两组case之间由空行隔开(该空行不用处理)
字符串长度len <= 110000
Output
每一行一个整数x,对应一组case,表示该组case的字符串中所包含的最长回文长度.
Sample Input
aaaa

abab

Sample Output
4
3
Source
题解:
第一次学习Manacher算法。我把我理解的写下来。这个算法求回文串的复杂度是O(n)的,只需要扫描一遍数组就可以得到解
首先分享一个写的非常好的博文:http://blog.csdn.net/muxidreamtohit/article/details/8865210
由于它介绍的太好了,我怕丢了,所以我决定复制在下面,这个算法很好理解,主要思想就是保存一个扩展最右端的点,这样这个最右端的左侧的点就不用再次匹配了,然后匹配右侧的并更新右端的

首先:大家都知道什么叫回文串吧,这个算法要解决的就是一个字符串中最长的回文子串有多长。这个算法可以在O(n)的时间复杂度内既线性时间复杂度的情况下,求出以每个字符为中心的最长回文有多长,
    这个算法有一个很巧妙的地方,它把奇数的回文串和偶数的回文串统一起来考虑了。这一点一直是在做回文串问题中时比较烦的地方。这个算法还有一个很好的地方就是充分利用了字符匹配的特殊性,避免了大量不必要的重复匹配。
    算法大致过程是这样。先在每两个相邻字符中间插入一个分隔符,当然这个分隔符要在原串中没有出现过。一般可以用‘#’分隔。这样就非常巧妙的将奇数长度回文串与偶数长度回文串统一起来考虑了(见下面的一个例子,回文串长度全为奇数了),然后用一个辅助数组P记录以每个字符为中心的最长回文串的信息。P[id]记录的是以字符str[id]为中心的最长回文串,当以str[id]为第一个字符,这个最长回文串向右延伸了P[id]个字符。
    原串:    w aa bwsw f d
    新串:   # w# a # a # b# w # s # w # f # d #
辅助数组P:  1 2 1 2 3 2 1 2 1 2 1 4 1 2 1 2 1 2 1
    这里有一个很好的性质,P[id]-1就是该回文子串在原串中的长度(包括‘#’)。如果这里不是特别清楚,可以自己拿出纸来画一画,自己体会体会。当然这里可能每个人写法不尽相同,不过我想大致思路应该是一样的吧。
    好,我们继续。现在的关键问题就在于怎么在O(n)时间复杂度内求出P数组了。只要把这个P数组求出来,最长回文子串就可以直接扫一遍得出来了。
    由于这个算法是线性从前往后扫的。那么当我们准备求P[i]的时候,i以前的P[j]我们是已经得到了的。我们用mx记在i之前的回文串中,延伸至最右端的位置。同时用id这个变量记下取得这个最优mx时的id值。(注:为了防止字符比较的时候越界,我在这个加了‘#’的字符串之前还加了另一个特殊字符‘$’,故我的新串下标是从1开始的)
好,到这里,我们可以先贴一份代码了。

  1. void pk()
    {
        int i;
        int mx = 0;
        int id;
        for(i=1; i<n; i++)
        {
            if( mx > i )
                p[i] = MIN( p[2*id-i], mx-i );        
            else
                p[i] = 1;
            for(; str[i+p[i]] == str[i-p[i]]; p[i]++)
                ;
            if( p[i] + i > mx )
            {
                mx = p[i] + i;
                id = i;
            }
        }
    }
   代码是不是很短啊,而且相当好写。很方便吧,还记得我上面说的这个算法避免了很多不必要的重复匹配吧。这是什么意思呢,其实这就是一句代码。
if( mx > i)
    p[i]=MIN( p[2*id-i], mx-i);
就是当前面比较的最远长度mx>i的时候,P[i]有一个最小值。这个算法的核心思想就在这里,为什么P数组满足这样一个性质呢?
   (下面的部分为图片形式)

hdu_3068 最长回文(Manacher算法)hdu_3068 最长回文(Manacher算法)

其实核心的一句话就在于回文翻转了还是回文这一句.

图上也是在诠释这一句,所以,利用前面已经匹配过的最大的回文串,就是尽可能利用访问过的资源

图1中,以如果i大于mx的话,那么就完全没有前面的信息可以用,只好乖乖的一个一个左右匹配,

但是如果i<mx的话,那么就说明前面可以有相应的资源可以利用.因为以id的左右的回文肯定包括i关于id对称的j点处的一部分或者全部回文.

所以如果是包括全部的话就是图1的情况

如果只是包含部分的情况那么就是图2.

那么由图2很清晰可以看到那个回文更短些,即mx-i

下面是这个题的代码:

 //manacher
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N = ;
char m[N];
char b[*N];
int sum[*N];
int cnt;
void bian(int len)
{
int i;
cnt = ;
b[] = '$';
for(int i = ; i< len; i++){
b[cnt++] = '#';
b[cnt++] = m[i];
}
b[cnt] = '#';
return;
}
int solve()
{
int Max = -;
int mx = ;
int k;
for(int i = ; i < cnt; i++)
{
if(i<mx)
sum[i] = min(sum[*k-i],mx-i);
else
sum[i] = ;
for(;b[i+sum[i]]==b[i-sum[i]];sum[i]++);//这里是为了处理sum[i] = mx-i的情况
if(i+sum[i]>mx)//每次都要更新最远端和最远端对应的中点的信息。
{
k = i;
mx = i + sum[i];
}
Max = max(Max,sum[i]);
}
return Max-;
}
int main()
{
while(~scanf("%s",m))
{
int len = strlen(m);
bian(len);
int ans = solve();
printf("%d\n",ans);
getchar();
}
return ;
}