[spoj DISUBSTR]后缀数组统计不同子串个数

时间:2023-03-09 19:08:51
[spoj DISUBSTR]后缀数组统计不同子串个数

题目链接:https://vjudge.net/contest/70655#problem/C

后缀数组的又一神奇应用。不同子串的个数,实际上就是所有后缀的不同前缀的个数。

考虑所有的后缀按照rank排好了,我们现在已知height,也就是相邻的两个的最长公共前缀是多少。那么不同的子串个数怎么统计呢?

从第一个串开始考虑,ans+=L1。再看第二个串,会加进来几个不同的前缀呢?就是ans+=L2-height[2]。第三个类似,会加进来ans+=L3-height[3]……

因此最后的结果就是ans=L*(L+1)/2-sigma(height[2..n])。L是整个字符串的长度。

不过看这个题的数据范围是可以hash搞过去的,但是这个题就不行了:https://vjudge.net/contest/70655#problem/D,而且这个题会爆long long......

#include<cstdio>
#include<algorithm>
#include<cstring>
#include<queue>
using namespace std; const int maxn=; #define F(x) ((x)/3+((x)%3==1?0:tb))
#define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)
int wa[maxn*],wb[maxn*],wv[maxn*],wss[maxn*];
int c0(int *r,int a,int b)
{
return r[a]==r[b] && r[a+]==r[b+] && r[a+]==r[b+];
}
int c12(int k,int *r,int a,int b)
{
if (k==) return r[a]<r[b] || (r[a]==r[b]&&c12(,r,a+,b+));
else return r[a]<r[b] || (r[a]==r[b]&&wv[a+]<wv[b+]);
}
void sort(int *r,int *a,int *b,int n,int m)
{
int i;
for (i=;i<n;i++) wv[i]=r[a[i]];
for (i=;i<m;i++) wss[i]=;
for (i=;i<n;i++) wss[wv[i]]++;
for (i=;i<m;i++) wss[i]+=wss[i-];
for (i=n-;i>=;i--) b[--wss[wv[i]]]=a[i];
}
void dc3(int *r,int *sa,int n,int m)
{
int i,j,*rn=r+n;
int *san=sa+n,ta=,tb=(n+)/,tbc=,p;
r[n]=r[n+]=;
for (i=;i<n;i++) if (i%!=) wa[tbc++]=i;
sort(r+,wa,wb,tbc,m);
sort(r+,wb,wa,tbc,m);
sort(r,wa,wb,tbc,m);
for (p=,rn[F(wb[])]=,i=;i<tbc;i++)
rn[F(wb[i])]=c0(r,wb[i-],wb[i])?p-:p++;
if (p<tbc) dc3(rn,san,tbc,p);
else for (i=;i<tbc;i++) san[rn[i]]=i;
for (i=;i<tbc;i++) if (san[i]<tb) wb[ta++]=san[i]*;
if (n%==) wb[ta++]=n-;
sort(r,wb,wa,ta,m);
for (i=;i<tbc;i++) wv[wb[i]=G(san[i])]=i;
for (i=,j=,p=;i<ta&&j<tbc;p++)
sa[p]=c12(wb[j]%,r,wa[i],wb[j])?wa[i++]:wb[j++];
for (;i<ta;p++) sa[p]=wa[i++];
for (;j<tbc;p++) sa[p]=wb[j++];
}
void da(int str[],int sa[],int rank[],int height[],int n,int m)
{
for (int i=n;i<n*;i++)
str[i]=;
dc3(str,sa,n+,m);
int i,j,k=;
for (i=;i<=n;i++) rank[sa[i]]=i;
for (i=;i<n;i++)
{
if (k) k--;
j=sa[rank[i]-];
while (str[i+k]==str[j+k]) k++;
height[rank[i]]=k;
}
}
char s[maxn];
int a[maxn*];
int ra[maxn*],height[maxn*],sa[maxn*]; int solve(int n)
{
// height[2..n]
int ans=n*(n+)/;
for (int i=;i<=n;i++) ans-=height[i];
return ans;
} int main()
{
int t;
scanf("%d",&t);
while (t--)
{
scanf("%s",s);
int l=strlen(s);
for (int i=;i<l;i++) a[i]=(int)s[i];
da(a,sa,ra,height,l,);
printf("%d\n",solve(l));
}
return ;
}