HDU - 5008 Boring String Problem(后缀数组+二分)

题目链接:点击查看

题目大意:给出一个字符串,接下来给出 q 个询问,每次询问字符串中第 k 大的子串,要求输出该字串的左右端点,如果有多个答案,输出左端点最小的一个

题目分析:因为在求出后缀数组后,sa数组已经保证了升序,且每个后缀中的前缀也按照升序排列,所以我们可以构造一个前缀和,因为每一个后缀贡献的不重复的子串个数为 n - sa[ i ] - height[ i ],这样就能二分找到第k大的子串第一次出现的位置了,为什么说是第一次出现的位置呢?因为在此之后,可能会有与当前子串重复的子串,且在原字符串中更靠左的位置,为了找出最左边的位置,我们需要枚举所有可能,所谓所有可能,就是从当前位置开始,往后寻找所有sa数组与当前的sa数组的前缀包含了当前子串的位置,具体实现看代码吧

代码:

#include<iostream>
#include<cstdio> 
#include<string>
#include<ctime>
#include<cstring>
#include<algorithm>
#include<stack>
#include<queue>
#include<map>
#include<set>
#include<cmath>
#include<sstream>
using namespace std;
 
typedef long long LL;
 
const int inf=0x3f3f3f3f;
 
const int N=1e5+100;
 
char str[N];
 
int sa[N]; //SA数组,表示将S的n个后缀从小到大排序后把排好序的
//的后缀的开头位置顺次放入SA中
int t1[N],t2[N],c[N];
 
int rk[N],height[N],len;
 
int s[N];

LL sum[N];
 
void build_sa(int s[],int n,int m)//n为添加0后的总长
{
    int i,j,p,*x=t1,*y=t2;
    for(i=0;i<m;i++) 
		c[i]=0;
    for(i=0;i<n;i++) 
		c[x[i]=s[i]]++;
    for(i=1;i<m;i++) 
		c[i]+=c[i-1];
    for(i=n-1;i>=0;i--) 
		sa[--c[x[i]]]=i;
    for(j=1;j<=n;j<<=1) 
	{
        p=0;
        for(i=n-j;i<n;i++) 
			y[p++]=i;
        for(i=0;i<n;i++) 
            if(sa[i]>=j) 
                y[p++]=sa[i]-j;
        for(i=0;i<m;i++) 
			c[i]=0;
        for(i=0;i<n;i++) 
			c[x[y[i]]]++;
        for(i=1;i<m;i++) 
			c[i]+=c[i-1];
        for(i=n-1;i>=0;i--) 
			sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1,x[sa[0]]=0;
        for(i=1;i<n;i++) 
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
        if(p>=n) 
			break;
        m=p;
    }
}
 
void get_height(int s[],int n)//n为添加0后的总长
{
    int i,j,k=0;
    for(i=0;i<=n;i++)
        rk[sa[i]]=i;
    for(i=0;i<n;i++) 
	{
        if(k) 
			k--;
        j=sa[rk[i]-1];
        while(s[i+k]==s[j+k]) 
			k++;
        height[rk[i]]=k;
    }
}
 
void solve(int base=128)
{
	build_sa(s,len+1,base);
	get_height(s,len);
}

int main()
{
//	freopen("input.txt","r",stdin);
//	ios::sync_with_stdio(false);
	while(scanf("%s",str)!=EOF)
	{
		len=strlen(str);
		for(int i=0;i<len;i++)
			s[i]=str[i]-'a'+1;
		s[len]=0;
		solve(30);
		for(int i=1;i<=len;i++)
			sum[i]=sum[i-1]+len-sa[i]-height[i];
		int m;
		scanf("%d",&m);
		int l=0,r=0;
		while(m--)
		{
			LL k;
			scanf("%lld",&k);
			k=(l^r^k)+1;
			if(k>sum[len])
			{
				printf("%d %d\n",l=0,r=0);
				continue;
			}
			int pos=lower_bound(sum+1,sum+1+len,k)-sum;//二分找到包含第一次出现第k大的子串的后缀
			l=sa[pos];//这里的l是第一次出现的第k大子串的左端点
			r=len-(sum[pos]-k+1);//右端点
			int lenn=r-l+1;//长度
			while(pos+1<=len&&height[pos+1]>=lenn)//枚举从当前位置开始往后的所有可能sa数组
			{
				pos++;
				l=min(l,sa[pos]);//维护最小值
				r=min(r,sa[pos]+lenn-1);
			}
			printf("%d %d\n",++l,++r);
		}
	}
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	return 0;
}
发布了558 篇原创文章 · 获赞 16 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_45458915/article/details/104081536