【模板】后缀排序

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sizeof_you/article/details/84504368

模板题

学习后缀数组的基础就是后缀排序啦
先说一下变量:
最重要的两个 s a r k sa和rk 数组:
s a [ i ] i sa[i]表示排名为i的位置
r k [ i ] i rk[i]表示位置i的后缀的排名
s a [ r k [ i ] ] = r k [ s a [ i ] ] = i sa[rk[i]]=rk[sa[i]]=i
辅助变量:
t a x tax 就是桶, t p tp 就是第二关键字,也用作 r k rk 的备份

后缀排序的实现就是:倍增+基数排序
基数排序又叫桶排序,简单说就是按照权值分配到桶里去完成排序

倍增一个长度,然后把这个长度的后缀接到上一个这么长的后缀后面,前面的是第一关键字,后面的就是第二关键字,桶排序按第一关键字,然后倒序枚举第二关键字就可以求出当前 s a sa
倍增直到每个位置的排名都不一样的时候就停止。
复杂度大概 O ( n l o g n ) O(nlogn)?

模拟过程可以看一眼这个图(盗来的):
在这里插入图片描述

最后代码实现:

注意这里的 m m 是权值的范围

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cmath>
#define N 1000005
using namespace std;
char s[N];
int n,m,sa[N],rk[N],tp[N],tax[N];

void rsort(){
	for(int i=1;i<=m;i++) tax[i]=0;
	for(int i=1;i<=n;i++) ++tax[rk[i]];//加入桶 
	for(int i=1;i<=m;i++) tax[i]+=tax[i-1];//求前缀 
	for(int i=n;i;i--) sa[tax[rk[tp[i]]]--]=tp[i];//倒序按第二关键字排序 
}

void ssort(){
	for(int i=1;i<=n;i++) rk[i]=s[i],tp[i]=i;
	rsort();//长度为1 
	for(int w=1,p=0;p<n && w<=n;m=p,w<<=1){
		p=0;//w为长度,p为计数器 
		for(int i=n-w+1;i<=n;i++) tp[++p]=i;//n-w+1~n,第二关键字最小 
		for(int i=1;i<=n;i++)
			if(sa[i]>w) tp[++p]=sa[i]-w;//要在一个后缀后面接一个后缀 
		rsort(); 
		swap(rk,tp);//备份 
		rk[sa[1]]=p=1;
		for(int i=2;i<=n;i++){
			if(tp[sa[i]]==tp[sa[i-1]] && tp[min(n+1,sa[i]+w)]==tp[min(n+1,sa[i-1]+w)])
				rk[sa[i]]=p;//如果第一关键字和第二关键字都和上一个一样 
			else rk[sa[i]]=++p;
		}
	}
}

int main(){
	scanf("%s",s+1); n=strlen(s+1); m=127;
	ssort();
	for(int i=1;i<=n;i++) printf("%d ",sa[i]);
	return 0; 
}

猜你喜欢

转载自blog.csdn.net/sizeof_you/article/details/84504368