【bzoj3881】[Coci2015]Divljak AC自动机+树链的并+DFS序+树状数组

时间:2022-10-04 17:26:00

题目描述

Alice有n个字符串S_1,S_2...S_n,Bob有一个字符串集合T,一开始集合是空的。
接下来会发生q个操作,操作有两种形式:
“1 P”,Bob往自己的集合里添加了一个字符串P。
“2 x”,Alice询问Bob,集合T中有多少个字符串包含串S_x。(我们称串A包含串B,当且仅当B是A的子串)
Bob遇到了困难,需要你的帮助。

输入

第1行,一个数n;
接下来n行,每行一个字符串表示S_i;
下一行,一个数q;
接下来q行,每行一个操作,格式见题目描述。

输出

对于每一个Alice的询问,帮Bob输出答案。

样例输入

3
a
bc
abc
5
1 abca
2 1
1 bca
2 2
2 3

样例输出

1
2
1


题解

AC自动机+树链的并+DFS序+树状数组

P的子串体现为前缀的后缀,某个前缀的所有后缀在AC自动机上体现为:Trie树上该前缀对应节点的fail树到根节点的链上节点。

因此对所有S串建立AC自动机,求出fail树,那么添加一个P串,它所包含的S串的范围就是P在Trie树上每个位置(P的每个前缀)fail树上到根节点所覆盖的所有节点,即把树链的并+1。

把所有位置按照DFS序排序,每个点到根节点路径上+1,每相邻两点LCA到根节点路径上-1。查询就是查单点权值。需要支持:到根节点的路径加、单点求值,差分后变为单点加、子树求值,使用DFS将子树转化为区间,再用树状数组维护区间和即可。

时间复杂度 $O(n\log n)$ 。

#include <queue>
#include <cstdio>
#include <algorithm>
#define N 100010
#define M 2000010
using namespace std;
queue<int> q;
int c[M][26] , fail[M] , tot = 1 , pos[N] , head[M] , to[M] , next[M] , cnt , fa[M][20] , deep[M] , log[M] , vp[M] , lp[M] , tp , f[M] , val[M] , tv;
char str[M];
void build()
{
int x , i;
for(i = 0 ; i < 26 ; i ++ ) c[0][i] = 1;
q.push(1);
while(!q.empty())
{
x = q.front() , q.pop();
for(i = 0 ; i < 26 ; i ++ )
{
if(c[x][i]) fail[c[x][i]] = c[fail[x]][i] , q.push(c[x][i]);
else c[x][i] = c[fail[x]][i];
}
}
}
inline void add(int x , int y)
{
to[++cnt] = y , next[cnt] = head[x] , head[x] = cnt;
}
void dfs(int x)
{
int i;
vp[x] = ++tp;
for(i = 1 ; i <= log[deep[x]] ; i ++ ) fa[x][i] = fa[fa[x][i - 1]][i - 1];
for(i = head[x] ; i ; i = next[i]) fa[to[i]][0] = x , deep[to[i]] = deep[x] + 1 , dfs(to[i]);
lp[x] = tp;
}
inline int lca(int x , int y)
{
int i;
if(deep[x] < deep[y]) swap(x , y);
for(i = log[deep[x] - deep[y]] ; ~i ; i -- )
if(deep[x] - deep[y] >= (1 << i))
x = fa[x][i];
if(x == y) return x;
for(i = log[deep[x]] ; ~i ; i -- )
if(deep[x] >= (1 << i) && fa[x][i] != fa[y][i])
x = fa[x][i] , y = fa[y][i];
return fa[x][0];
}
inline void fix(int x , int a)
{
int i;
for(i = x ; i <= tp ; i += i & -i) f[i] += a;
}
inline int query(int x)
{
int i , ans = 0;
for(i = x ; i ; i -= i & -i) ans += f[i];
return ans;
}
bool cmp(int a , int b)
{
return vp[a] < vp[b];
}
int main()
{
int n , m , i , j , t , opt , x;
scanf("%d" , &n);
for(i = 1 ; i <= n ; i ++ )
{
scanf("%s" , str) , t = 1;
for(j = 0 ; str[j] ; j ++ )
{
if(!c[t][str[j] - 'a']) c[t][str[j] - 'a'] = ++tot;
t = c[t][str[j] - 'a'];
}
pos[i] = t;
}
build();
for(i = 2 ; i <= tot ; i ++ ) add(fail[i] , i) , log[i] = log[i >> 1] + 1;
dfs(1);
scanf("%d" , &m);
while(m -- )
{
scanf("%d" , &opt);
if(opt == 1)
{
scanf("%s" , str) , t = 1 , tv = 0;
for(i = 0 ; str[i] ; i ++ ) t = c[t][str[i] - 'a'] , val[++tv] = t;
sort(val + 1 , val + tv + 1 , cmp);
for(i = 1 ; i <= tv ; i ++ ) fix(vp[val[i]] , 1);
for(i = 1 ; i < tv ; i ++ ) fix(vp[lca(val[i] , val[i + 1])] , -1);
}
else scanf("%d" , &x) , printf("%d\n" , query(lp[pos[x]]) - query(vp[pos[x]] - 1));
}
return 0;
}