版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sizeof_you/article/details/84525235
hdu4622
后缀数组基础题?
昨天学了后缀排序其实最有用的是后缀数组求
?
用了一个
,也就是排名为
的和排名
的后缀的
为了方便,设
就是
位置的后缀和它前一名的后缀的
有几个性质:
,证明可以感性理解一下,把
和它的上一名同时去掉第一位就是
有了这个就可以快速求出
数组:
inline void geth(){
int j,k=0;
for(int i=1;i<=n;i++){
if(k) --k;
j=sa[rk[i]-1];
while(s[i+k]==s[j+k]) ++k;
h[rk[i]]=k;
}
}
还有
这个也可以感性理解一下,手动模拟之类的
有了这个就可以快速求出
,这道题中套一个
表求区间最小值就好了
inline int query(int l,int r){
int k=log2(r-l+1);
return min(st[l][k],st[r-(1<<k)+1][k]);
}
//st表,区间min
inline int lcp(int l,int r){
if(l>r) swap(l,r);
return query(l+1,r);
}
然后再回来看这道题,区间
本质不同的子串其实就是所有后缀的长度减去它和之前后缀的
,因为它的
是之前出现过的,然后后面每加一个字符就可以产生一个新的。
而且因为后缀排序的特性,不会出现某两个排名
且
,所以这个方法是正确的
最后放代码:
#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cmath>
#include<vector>
#define maxn 2005
using namespace std;
inline int rd(){
int x=0,f=1;char c=' ';
while(c<'0' || c>'9') f=c=='-'?-1:1,c=getchar();
while(c<='9' && c>='0') x=x*10+c-'0',c=getchar();
return x*f;
}
int t,n,m,q,sa[maxn],rk[maxn],tp[maxn],tax[maxn],h[maxn],st[maxn][12];
char s[maxn];
inline void rsort(){
for(int i=1;i<=m;i++) tax[i]=0;
for(int i=1;i<=n;i++) ++tax[rk[i]];
for(int i=1;i<=m;i++) tax[i]+=tax[i-1];
for(int i=n;i;i--) sa[tax[rk[tp[i]]]--]=tp[i];
}
//基数排序
inline void ssort(){
for(int i=1;i<=n;i++) rk[i]=s[i],tp[i]=i;
rsort();
for(int w=1,p=0;p<n && w<=n;w<<=1,m=p){
p=0;
for(int i=n-w+1;i<=n;i++) tp[++p]=i;
for(int i=1;i<=n;i++)
if(sa[i]>w) tp[++p]=sa[i]-w;
rsort();
swap(rk,tp);
rk[sa[1]]=p=1;
for(int i=2;i<=n;i++)
if(tp[sa[i]]==tp[sa[i-1]] && tp[sa[i]+w]==tp[sa[i-1]+w])
rk[sa[i]]=p;
else rk[sa[i]]=++p;
}
}
//后缀排序
inline void geth(){
int j,k=0;
for(int i=1;i<=n;i++){
if(k) --k;
j=sa[rk[i]-1];
while(s[i+k]==s[j+k]) ++k;
h[rk[i]]=k;
}
}
//求h数组
void prework(){
for(int i=1;i<=n;i++) st[i][0]=h[i];
for(int j=1;(1<<j)<n;j++)
for(int i=1;i+(1<<j)-1<=n;i++)
st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
inline int query(int l,int r){
int k=log2(r-l+1);
return min(st[l][k],st[r-(1<<k)+1][k]);
}
//st表,区间min
inline int lcp(int l,int r){
if(l>r) swap(l,r);
return query(l+1,r);
}
//求lcp,lcp(i,j)=min(h[k]) i+1<=k<=j
inline int ask(int l,int r){
vector<int> pos;
for(int i=1;i<=n;i++)
if(l<=sa[i] && sa[i]<=r) pos.push_back(sa[i]);
int sum=r-pos[0]+1,tmp=sum;//sum:答案,tmp:当前后缀与之前所有后缀的lcp
for(int i=1;i<pos.size();i++){
int k=lcp(rk[pos[i]],rk[pos[i-1]]),len=r-pos[i]+1;//k当前与上一个的lcp
tmp=min(tmp,k);//k<tmp,tmp一定=k
tmp=max(tmp,min(k,r-pos[i-1]+1));//k>tmp,tmp可能为k,但不能超过上一个长度
sum+=len-min(tmp,len);
}
return sum;
}
int main(){
t=rd();
while(t--){
scanf("%s",s+1); n=strlen(s+1); m=127;
ssort(); geth(); prework();
q=rd();
while(q--){
int l=rd(),r=rd();
if(l>r) swap(l,r);
printf("%d\n",ask(l,r));
}
}
return 0;
}