题目:给出一个字符串,求不同的子串中排名第k小的子串,并求出字符串的起止位置,如果有多个重复的子串,求出位置最靠左的子串。
思路:子串是后缀的前缀,后缀数组对后缀排序的同时,也对子串进行了排序。对于每一个sa[i],会产生n - sa[i] - height[i]个不同的子串,而且这些子串也是排好序的。维护一个n - sa[i] - height[i]的前缀和,二分找一下就可以,找重复的里面的最左边位置时,可以用rmq,我这里没用也水过了hhh。因为查询是k=v^l^r ,需要注意的是不存在时输出0 0也要更新l=0,r=0,k是long long 的。昨晚训练时因为这些小错误wa了好多发。
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int maxn=200010;
int t1[maxn],t2[maxn],c[maxn];
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int sa[],int ra[],int height[],int n,int m)
{
n++;
int p,*x=t1,*y=t2;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[i]=str[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int j=1;j<=n;j<<=1)
{
p=0;
for(int i=n-j;i<n;i++) y[p++]=i;
for(int i=0;i<n;i++)
if(sa[i]>=j) y[p++]=sa[i]-j;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[y[i]]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(int i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n) break;
m=p;
}
int k=0;
n--;
for(int i=0;i<=n;i++) ra[sa[i]]=i;
for(int i=0;i<n;i++)
{
if(k) k--;
int j=sa[ra[i]-1];
while(str[i+k]==str[j+k])k++;
height[ra[i]]=k;
}
}
int n,k;
int ra[maxn],height[maxn],str[maxn],sa[maxn];
ll num[maxn];
char s[maxn];
int main()
{
while(~scanf("%s",s))
{
int n=strlen(s);
for(int i=0;i<n;i++)
str[i]=s[i]-'a'+1;
str[n]=27;
str[n+1]=0;
da(str,sa,ra,height,n+1,28);
/*
for(int i=1; i<=n; ++i)
{
printf("sa[%2d ] = %2d\t",i,sa[i]);
for(int j=sa[i]; j<n; ++j)
printf("%d",str[j]);
puts("");
}
puts("");
*/
num[0]=0;
for(int i=1;i<=n;i++)
num[i]=num[i-1]+n-sa[i]-height[i];
int q;
scanf("%d",&q);
ll l=0,r=0;
while(q--)
{
ll k;
scanf("%lld",&k);
k=l^r^k;
int i=lower_bound(num+1,num+n+1,k+1)-num;
if(i>n)
{
puts("0 0");
l=r=0;
continue;
}
k=k-num[i-1]+height[i];
l=sa[i]+1;
int j=i;
while(j>1&&height[j]>k)
{
l=min(l,(ll)(sa[j-1]+1));
j--;
}
j=i+1;
while(j<=n&&height[j]>k)
{
l=min(l,(ll)(sa[j]+1));
j++;
}
r=l+k;
printf("%lld %lld\n",l,r);
}
}
return 0;
}
/*
aabaaa
2
2
1
aaa
4
0
2
3
5
*/