bzoj千题计划250:bzoj3670: [Noi2014]动物园

时间:2022-02-11 20:20:38

http://www.lydsy.com/JudgeOnline/problem.php?id=3670

法一:KMP+st表

抽离nxt数组,构成一棵树

若nxt[i]=j,则i作为j的子节点

那么num[i] 就是i到根节点的路径上,所有<=i/2 的节点的个数

这棵树的点随深度的递增而增大

所以用st表存这棵树

st 表 开[logn][n],常数优化求st表的过程

#include<cmath>
#include<cstdio>
#include<cstring> #define N 1000001 using namespace std; const int mod=1e9+; char s[N];
int len; int f[N]; int dep[N],st[][N];
int num[N]; void get_next()
{
int j;
for(int i=;i<len;++i)
{
j=f[i];
while(j && s[i]!=s[j]) j=f[j];
f[i+]= s[j]==s[i] ? j+ : ;
}
} void solve()
{
for(int i=;i<=len;++i) st[][i]=f[i],dep[i]=dep[f[i]]+;
int lim=1.0*log(len)/log();
for(int j=;j<=lim;++j)
for(int i=;i<=len;++i)
st[j][i]=st[j-][st[j-][i]];
int now;
for(int i=;i<=len;++i)
{
now=i;
for(int j=lim;j>=;--j)
if(st[j][now]*>i) now=st[j][now];
num[i]=dep[now]-;
}
int ans=;
for(int i=;i<=len;++i) ans=1LL*ans*(num[i]+)%mod;
printf("%d\n",ans);
} int main()
{
//freopen("data.in","r",stdin);
//freopen("my.out","w",stdout);
int T;
scanf("%d",&T);
while(T--)
{
scanf("%s",s);
len=strlen(s);
get_next();
solve();
}
}

法二:kmp 变形

求一个数组cnt[i] ,前i个字符构成的字符串中,既是它的后缀同时又是它的前缀 的子串个数

即原题中的num[i] 去掉不能重叠的限制

那么num[i] 就是k从nxt[i]往前跳,跳到的第一个满足k*2<=i 的cnt[k]

#include<cstdio>
#include<cstring> using namespace std; #define N 1000001 const int mod=1e9+; char s[N];
int len; int f[N],cnt[N]; void getnxt()
{
int ans=;
len=strlen(s+);
cnt[]=;
int j=,k;
for(int i=;i<=len;++i)
{
while(j && s[i]!=s[j+]) j=f[j];
if(s[j+]==s[i]) j++;
f[i]=j;
cnt[i]=cnt[j]+;
}
} void solve()
{
int ans=;
int k=;
for(int i=;i<=len;++i)
{
while(k && s[k+]!=s[i]) k=f[k];
if(s[k+]==s[i]) k++;
while(k*>i) k=f[k];
ans=1LL*ans*(cnt[k]+)%mod;
}
printf("%d\n",ans);
} int main()
{
// freopen("zoo.in","r",stdin);
// freopen("zoo.out","w",stdout);
int T;
scanf("%d",&T);
while(T--)
{
scanf("%s",s+);
getnxt();
solve();
}
}

法三:哈希+二分+差分

(本思路来自myj,ORZZZZZZ)

对于每一个i,求一个以i为后缀左端点,满足既是后缀又是前缀的 最大的后缀(前缀)长度

设其为t,这可以哈希+二分求

那么num[i]~num[i+t-1] 都会有一个贡献

差分,求前缀和即可得num数组

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
typedef unsigned long long ll;
const int mod1=;
const int mod2=;
const int mod=1e9+;
const int maxn=1e6+;
int T,n,num[maxn];
ll Hash1[maxn],Hash2[maxn],hpos1[maxn],hpos2[maxn];
char str[maxn];
inline int getlen(int x)
{
int l=,r=std::min(n-x+,(x-)*-x+),mid,res=;
while(l<=r)
{
mid=l+r>>;
if(Hash1[mid]==(Hash1[x+mid-]-Hash1[x-]*hpos1[mid])
&&Hash2[mid]==(Hash2[x+mid-]-Hash2[x-]*hpos2[mid]))
{
res=mid;
l=mid+;
}
else
r=mid-;
}
return res;
}
int main()
{
hpos1[]=hpos2[]=;
for(int i=;i<maxn;i++)
{
hpos1[i]=hpos1[i-]*mod1;
hpos2[i]=hpos2[i-]*mod2;
}
std::cin>>T;
while(T--)
{
scanf("%s",str+);
n=strlen(str+);
num[]=;
for(int i=;i<=n;i++)
{
num[i]=;
Hash1[i]=Hash1[i-]*mod1+str[i]-'a'+;
Hash2[i]=Hash2[i-]*mod2+str[i]-'a'+;
}
for(int i=,t;i<=n;i++)
{
t=getlen(i);
num[i]++;
num[i+t]--;
}
ll res=,now=;
for(int i=;i<=n;i++)
(res*=(now+=num[i]))%=mod;
std::cout<<res<<std::endl;
}
return ;
}

3670: [Noi2014]动物园

Time Limit: 10 Sec  Memory Limit: 512 MB
Submit: 3320  Solved: 1798
[Submit][Status][Discuss]

Description

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。

某天,园长给动物们讲解KMP算法。

园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”

熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”

园长:“非常好!那你能举个例子吗?”

熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”

园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。

下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”

最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?

特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出bzoj千题计划250:bzoj3670: [Noi2014]动物园对1,000,000,007取模的结果即可。

bzoj千题计划250:bzoj3670: [Noi2014]动物园

Input

第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

Output

包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。

Sample Input

3
aaaaa
ab
abcababc

Sample Output

36
1
32

HINT

n≤5,L≤1,000,000