[HDU4787]GRE Words Revenge 解题报告

时间:2021-02-09 08:19:07

  这是我之前博客里提到的一道AC自动机的练手题,但是要完成这道题,我之前博客里提到的东西还不够,这里总结一下这道题。

  这道题不是一般的裸的AC自动机,它的询问和插入是交叉出现的所以用我之前写的板子不大合适,这道题在构建自动机时不能改变原有的 Trie树 的结构,所以没有代表字符串的结点的不需要去改它的值,所以我在 build() 函数 处做了一些修改。在复杂度方面,如果是强上普通的AC自动机,最差会达到O(n^2),感觉不太好。我们这里可以用到平方分割的套路,搞大小两个自动机,每次插入都在小自动机上进行,当小自动机里的结点达到一定量(sqrt(n))时,就将两自动机合并,并将小自动机清空。合并的方式也很好理解,就将两个自动机的节点一一对应,若小自动机上的结点在大自动机上没有,就在大自动机上新建结点,并修改它的值。总复杂度大概是这样:O(n*sqrt(n)(小的)+O(sqrt(n)*n)(大的)=O(n*sqrt(n))。其实那个上界也不一定要严格的根号n,自己大概估计一个常数就差不多了。哦对,还有一点,我发现好多板子里在构建新结点时都打了一个 newnode() 函数,包括我自己的板子也是这么打的。这样打其实是很慢的,我在做这道题时就各种 T飞 ,后来把这个去掉搞成其他的方法就快了很多(虽然我也不知道为什么),下面的代码里会体现。

  祝大家切题愉快

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
#include<queue>
#define maxn (511111)
#define N (6000000)
#define il inline
#define ll long long
#define RG register
using namespace std;
char s[N],ss[N];

struct Trie{
	int son[maxn][2],fail[maxn],size,root;
	bool val[maxn];     //标记是否出现
	il void init(){
		size=1;	root=0;
		memset(son,0,sizeof(son));
		memset(val,0,sizeof(val));
		memset(fail,0,sizeof(fail));
	}

	il int idx(char c){  //卡常专用
		return c-'0';
	}

	il int insert(char *s){     //插入新单词
		RG int cur=root;
		for(RG int i=0;s[i];i++){   //卡常小技巧,不要每次计算len
			RG int id=idx(s[i]);
			if( !son[cur][id] ) son[cur][id]=size++;
			cur=son[cur][id];
		}
		val[cur]=true;
		return cur;
	}

	il bool in(char *s){        //查询单词是否在自动机内
		RG int cur=root;
		for(RG int i=0;s[i];i++){
			RG int id=idx(s[i]);
			if( !son[cur][id] ) return false;
			cur=son[cur][id];
		}
		return val[cur];
	}

	il void build(){        //构建自动机
		queue<int>Q;
		for(RG int i=0;i<2;i++)
			if( son[root][i] )       //只加入队列,不用修改值
       	Q.push(son[root][i]);

		while(!Q.empty()){
			RG int cur=Q.front(); Q.pop();
			for(RG int i=0;i<2;i++){
				RG int Son=son[cur][i];
				if(!Son) continue;
				Q.push(Son);         //同上
				RG int f=fail[cur];
				while(f && !son[f][i] ) f=fail[f];
				fail[Son]=son[f][i];
			}
		}
	}

	il int query(char *s){     //查询次数
		RG int cur=root,ans=0;
		for(RG int i=0;s[i];i++){
			RG int id=idx(s[i]);
			while(cur && !son[cur][id] ) cur=fail[cur];
			cur=son[cur][id];
			RG int k=cur;
			while(k){
				ans+=val[k];
				k=fail[k];
			}
		}
		return ans;
	}
}small,big;

il void dfs(RG int u,RG int v){        //用于合并
	for(RG int i=0;i<2;i++)
		if(small.son[v][i]){
			RG int cur2=small.son[v][i];
			if( !big.son[u][i] ){
				memset(big.son[big.size],0,sizeof(big.son[big.size]));
				big.son[u][i]=big.size++;       //建立新结点
			}
			RG int cur1=big.son[u][i];
			big.val[cur1] |=small.val[cur2];
			dfs(cur1,cur2);
		}
}

il void join(){
	dfs(0,0);
	small.init();
	big.build();
}

int main(){
	RG int Case,n;
	scanf("%d",&Case);
	for(RG int k=1;k<=Case;k++){
		printf("Case #%d:\n",k);
		scanf("%d",&n);
		small.init();  big.init();
		RG int l=0;
		while(n--){
			scanf("%s",s);
			RG int len=strlen(s+1);
			ss[0]=s[0];
			for(RG int i=0;i<len;i++)
				ss[i+1]=s[ (i+l%len+len)%len+1 ];
			ss[len+1]='\0';
			if(ss[0]=='+'){
                      if( small.in(ss+1) || big.in(ss+1) ) continue;
                      //若该单词已经存在就跳过
				small.insert(ss+1);  small.build();
				if( small.size>2333 ) join();
			}
			else{
				l=small.query(ss+1)+big.query(ss+1);
				printf("%d\n",l);
			}
		}
	}
	return 0;
}

  真是服了这鬼畜的缩进。。。真难看。。。