HDU 5679 Substring 后缀数组判重

时间:2023-01-10 23:12:14

题意:求母串中有多少不同的包含x字符的子串

分析:(首先奉上FZU官方题解)

HDU 5679  Substring  后缀数组判重

上面那个题就是SPOJ694 ,其实这两个题一样,原理每次从小到大扫后缀sa数组,加上新的当前后缀的若干前缀,再减去重复的

吐槽:因为打多校的时候忘记了后缀数组(其实是就算记着也不会做这题),所以傻逼了,所以眼看无数人1y这题,让我一度产生了暴力的想法

还是太弱,太傻逼

#include <iostream>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <cstdlib>
#include <string>
#include <algorithm>
#include <stack>
#include <queue>
#include <set>
#include <map>
#include <utility>
#include <vector>
using namespace std;
typedef long long LL;
const int N = 1e5+;
int cmp(int *r,int a,int b,int l){
return (r[a]==r[b]) && (r[a+l]==r[b+l]);
}
// 用于比较第一关键字与第二关键字,
// 比较特殊的地方是,预处理的时候,r[n]=0(小于前面出现过的字符)
int wa[N],wb[N],ww[N],wv[N];
int ran[N],height[N];
void DA(int *r,int *sa,int n,int m){ //此处N比输入的N要多1,为人工添加的一个字符,用于避免CMP时越界
int i,j,p,*x=wa,*y=wb,*t;
for(i=;i<m;i++) ww[i]=;
for(i=;i<n;i++) ww[x[i]=r[i]]++;
for(i=;i<m;i++) ww[i]+=ww[i-];
for(i=n-;i>=;i--) sa[--ww[x[i]]]=i; //预处理长度为1
for(j=,p=;p<n;j*=,m=p) //通过已经求出的长度J的SA,来求2*J的SA
{
for(p=,i=n-j;i<n;i++) y[p++]=i; // 特殊处理没有第二关键字的
for(i=;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; //利用长度J的,按第二关键字排序
for(i=;i<n;i++) wv[i]=x[y[i]];
for(i=;i<m;i++) ww[i]=;
for(i=;i<n;i++) ww[wv[i]]++;
for(i=;i<m;i++) ww[i]+=ww[i-];
for(i=n-;i>=;i--) sa[--ww[wv[i]]]=y[i]; //基数排序部分
for(t=x,x=y,y=t,p=,x[sa[]]=,i=;i<n;i++)
x[sa[i]]=cmp(y,sa[i-],sa[i],j)?p-:p++; //更新名次数组x[],注意判定相同的
}
}
void calheight(int *r,int *sa,int n){ // 此处N为实际长度
int i,j,k=; // height[]的合法范围为 1-N, 其中0是结尾加入的字符
for(i=;i<=n;i++) ran[sa[i]]=i; // 根据SA求RANK
for(i=;i<n; height[ran[i++]] = k ) // 定义:h[i] = height[ rank[i] ]
for(k?k--:,j=sa[ran[i]-]; r[i+k]==r[j+k]; k++); //根据 h[i] >= h[i-1]-1 来优化计算height过程
}
char s[N],inc[];
int sa[N],n,r[N],T,match[N],kase;
int main(){
scanf("%d",&T);
while(T--){
scanf("%s%s",inc,s);
n=strlen(s);
int last=n;
for(int i=;i<n;++i)
r[i]=s[i]-'a'+;
for(int i=n-;i>=;--i){
if(s[i]==inc[])last=i;
match[i]=last;
}
r[n]=;
DA(r,sa,n+,);
calheight(r,sa,n);
LL ans = ;
for(int i=;i<=n;++i){
int tmp=max(sa[i]+height[i],match[sa[i]]);
ans+=n-tmp;
}
printf("Case #%d: %I64d\n",++kase,ans);
}
return ;
}