题目链接:点击查看
题目大意:给出一个字符串,接下来给出 q 个询问,每次询问字符串中第 k 大的子串,要求输出该字串的左右端点,如果有多个答案,输出左端点最小的一个
题目分析:因为在求出后缀数组后,sa数组已经保证了升序,且每个后缀中的前缀也按照升序排列,所以我们可以构造一个前缀和,因为每一个后缀贡献的不重复的子串个数为 n - sa[ i ] - height[ i ],这样就能二分找到第k大的子串第一次出现的位置了,为什么说是第一次出现的位置呢?因为在此之后,可能会有与当前子串重复的子串,且在原字符串中更靠左的位置,为了找出最左边的位置,我们需要枚举所有可能,所谓所有可能,就是从当前位置开始,往后寻找所有sa数组与当前的sa数组的前缀包含了当前子串的位置,具体实现看代码吧
代码:
#include<iostream>
#include<cstdio>
#include<string>
#include<ctime>
#include<cstring>
#include<algorithm>
#include<stack>
#include<queue>
#include<map>
#include<set>
#include<cmath>
#include<sstream>
using namespace std;
typedef long long LL;
const int inf=0x3f3f3f3f;
const int N=1e5+100;
char str[N];
int sa[N]; //SA数组,表示将S的n个后缀从小到大排序后把排好序的
//的后缀的开头位置顺次放入SA中
int t1[N],t2[N],c[N];
int rk[N],height[N],len;
int s[N];
LL sum[N];
void build_sa(int s[],int n,int m)//n为添加0后的总长
{
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++)
c[i]=0;
for(i=0;i<n;i++)
c[x[i]=s[i]]++;
for(i=1;i<m;i++)
c[i]+=c[i-1];
for(i=n-1;i>=0;i--)
sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++)
y[p++]=i;
for(i=0;i<n;i++)
if(sa[i]>=j)
y[p++]=sa[i]-j;
for(i=0;i<m;i++)
c[i]=0;
for(i=0;i<n;i++)
c[x[y[i]]]++;
for(i=1;i<m;i++)
c[i]+=c[i-1];
for(i=n-1;i>=0;i--)
sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1,x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
if(p>=n)
break;
m=p;
}
}
void get_height(int s[],int n)//n为添加0后的总长
{
int i,j,k=0;
for(i=0;i<=n;i++)
rk[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)
k--;
j=sa[rk[i]-1];
while(s[i+k]==s[j+k])
k++;
height[rk[i]]=k;
}
}
void solve(int base=128)
{
build_sa(s,len+1,base);
get_height(s,len);
}
int main()
{
// freopen("input.txt","r",stdin);
// ios::sync_with_stdio(false);
while(scanf("%s",str)!=EOF)
{
len=strlen(str);
for(int i=0;i<len;i++)
s[i]=str[i]-'a'+1;
s[len]=0;
solve(30);
for(int i=1;i<=len;i++)
sum[i]=sum[i-1]+len-sa[i]-height[i];
int m;
scanf("%d",&m);
int l=0,r=0;
while(m--)
{
LL k;
scanf("%lld",&k);
k=(l^r^k)+1;
if(k>sum[len])
{
printf("%d %d\n",l=0,r=0);
continue;
}
int pos=lower_bound(sum+1,sum+1+len,k)-sum;//二分找到包含第一次出现第k大的子串的后缀
l=sa[pos];//这里的l是第一次出现的第k大子串的左端点
r=len-(sum[pos]-k+1);//右端点
int lenn=r-l+1;//长度
while(pos+1<=len&&height[pos+1]>=lenn)//枚举从当前位置开始往后的所有可能sa数组
{
pos++;
l=min(l,sa[pos]);//维护最小值
r=min(r,sa[pos]+lenn-1);
}
printf("%d %d\n",++l,++r);
}
}
return 0;
}