【BZOJ-1014】火星人prefix Splay + 二分 + Hash

时间:2024-03-26 16:04:56

1014: [JSOI2008]火星人prefix

Time Limit: 10 Sec  Memory Limit: 162 MB
Submit:
5852  Solved: 1871
[Submit][Status][Discuss]

Description

  火星人最近研究了一种操作:求一个字串两个后缀的公共前缀。比方说,有这样一个字符串:madamimadam,我们将这个字符串的各个字符予以标号:序号:
1 2 3 4 5 6 7 8 9 10 11 字符 m a d a m i m a d a m 现在,火星人定义了一个函数LCQ(x,
y),表示:该字符串中第x个字符开始的字串,与该字符串中第y个字符开始的字串,两个字串的公共前缀的长度。比方说,LCQ(1, 7) = 5,
LCQ(2, 10) = 1, LCQ(4, 7) = 0
在研究LCQ函数的过程中,火星人发现了这样的一个关联:如果把该字符串的所有后缀排好序,就可以很快地求出LCQ函数的值;同样,如果求出了LCQ函数的值,也可以很快地将该字符串的后缀排好序。
尽管火星人聪明地找到了求取LCQ函数的快速算法,但不甘心认输的地球人又给火星人出了个难题:在求取LCQ函数的同时,还可以改变字符串本身。具体地说,可以更改字符串中某一个字符的值,也可以在字符串中的某一个位置插入一个字符。地球人想考验一下,在如此复杂的问题中,火星人是否还能够做到很快地求取LCQ函数的值。

Input

  第一行给出初始的字符串。第二行是一个非负整数M,表示操作的个数。接下来的M行,每行描述一个操作。操作有3种,如下所示
1、询问。语法:Qxy,x,y均为正整数。功能:计算LCQ(x,y)限制:1<=x,y<=当前字符串长度。
2、修改。语法:Rxd,x是正整数,d是字符。功能:将字符串中第x个数修改为字符d。限制:x不超过当前字符串长度。
3、插入:语法:Ixd,x是非负整数,d是字符。功能:在字符串第x个字符之后插入字符d,如果x=0,则在字符串开头插入。限制:x不超过当前字符串长度

Output

  对于输入文件中每一个询问操作,你都应该输出对应的答案。一个答案一行。

Sample Input

madamimadam
7
Q 1 7
Q 4
8
Q 10 11
R 3 a
Q 1 7
I 10 a
Q 2 11

Sample Output

5
1
0
2
1

HINT

1、所有字符串自始至终都只有小写字母构成。
2、M<=150,000
3、字符串长度L自始至终都满足L<=100,000
4、询问操作的个数不超过10,000个。
对于第1,2个数据,字符串长度自始至终都不超过1,000
对于第3,4,5个数据,没有插入操作。

Source

Solution

首先考虑静态的做法:显然有求出后缀数组和height数组之后RMQ做,当然可以Hash

带上插入修改之后,显然不能用后缀数组了,所以还是考虑Hash

Hash的做法就是二分长度,用Hash值判断结果,

这里同理,用Splay去维护一个字符串,同时维护Hash值,询问就是二分长度,比较Hash值

这里Hash的方法可以考虑一下,可以采用%大质数的方法,不过效率极低,建议直接自然溢出即可

Splay维护的各个操作时间复杂度是$O(log_{2}n)$的,查询还有$log_{2}n$的二分,所以查询的复杂度是$O(log^{2}_{2}n)$

但是询问较少,于是总复杂度介于$O(nlog_{2}n)~O(nlog_{2}^{2}n)$之间,并更接近于$O(nlog_{2}n)$

Code

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cmath>
#include<cstring>
using namespace std;
#define MAXN 200010
char s[MAXN];
#define BASE 13
int hash[MAXN],key[MAXN],root,sz,size[MAXN],son[MAXN][],fa[MAXN],bin[MAXN],n,m;
void Update(int x)
{
int ls=son[x][],rs=son[x][];
size[x]=size[ls]+size[rs]+;
hash[x]=hash[ls]+bin[size[ls]]*(key[x]+hash[rs]*BASE);
}
int Get(int x) {return son[fa[x]][]==x;}
void Rotate(int x)
{
int f=fa[x],gf=fa[f],wh=Get(x);
son[f][wh]=son[x][wh^]; fa[son[f][wh]]=f;
fa[f]=x; son[x][wh^]=f; fa[x]=gf;
if (gf) son[gf][son[gf][]==f]=x;
Update(f); Update(x);
}
void Splay(int x,int tar)
{
for (int f; (f=fa[x])!=tar; Rotate(x))
if (fa[f]!=tar)
Rotate(Get(x)==Get(f)? f:x);
if (!tar) root=x;
}
void BuildTree(int l,int r,int x)
{
int mid=(l+r)>>;
fa[mid]=x; size[mid]=;
if (mid<x) son[x][]=mid; else son[x][]=mid;
if (mid!= && mid!=n) key[mid]=s[mid]-'a'+;
if (l==r) {hash[l]=key[l]; return;}
if (l<mid) BuildTree(l,mid-,mid);
if (r>mid) BuildTree(mid+,r,mid);
Update(mid);
}
int Find(int x,int rank)
{
int ls=son[x][],rs=son[x][];
if (size[ls]+==rank) return x;
else if (size[ls]>=rank) return Find(ls,rank);
else return Find(rs,rank-size[ls]-);
}
void Insert(int x,int val)
{
int A=Find(root,x+),B=Find(root,x+);
Splay(A,),Splay(B,root);
sz++; son[B][]=sz; fa[sz]=B; key[sz]=val;
Update(sz); Update(B); Update(A);
}
int Query(int x,int val)
{
int A=Find(root,x),B=Find(root,x+val+);
Splay(A,); Splay(B,root);
return hash[son[B][]];
}
void Change(int x,int val)
{
int A=Find(root,x+);
Splay(A,);
key[root]=val;
Update(root);
}
void LCQ(int x,int y)
{
if (x>y) swap(x,y);
int l=,r=sz-y-,ans=;
while (l<=r)
{
int mid=(l+r)>>;
if (Query(x,mid)==Query(y,mid)) l=mid+,ans=mid;
else r=mid-;
}
printf("%d\n",ans);
}
int main()
{
scanf("%s",s+);
bin[]=; for (int i=; i<=MAXN-; i++) bin[i]=bin[i-]*BASE;
n=strlen(s+)+; sz=n;
BuildTree(,n,); root=(+n)>>;
scanf("%d",&m);
while (m--)
{
char opt[]; scanf("%s",opt);
int x,y; char ss[];
switch (opt[])
{
case 'Q': scanf("%d%d",&x,&y); LCQ(x,y); break;
case 'R': scanf("%d%s",&x,ss+); Change(x,ss[]-'a'+); break;
case 'I': scanf("%d%s",&x,ss+); Insert(x,ss[]-'a'+); break;
}
}
return ;
}

好的,这里有个问题,我们都知道,最长公共前缀缩写是:$LCP$ (the Longest Common Prefix)

那么$LCQ$是什么意思呢? (the Longest Common Qianzhui??)