题意
题解
网上很少能找到能看的后缀数组的题解,我就写一篇好了。
我们发现这道题很能兼容后缀数组,把两个串用特殊符号分隔开处理出 SA 和 h ,那么配对两个子串的代价就是 m 减去它们的 lcp 长度,而 lcp 则是两个串在 h 数组上的区间最小值。
这都是 SA 最常见的用法,可以说,这道题生下来就是为了 SA。
接下来怎么做呢 ?
贪心地想,我们可以尽量先把 lcp 长的两个串配对,
lcp 更长的串,那么它们在 SA 上相对来说就要隔得近一些,归纳一下四个点的情况,再类推就可以很好地证明或理解这个贪心思路,这样配对一定没有更优的方案,这里我就不画图列式证明了,没必要。
于是又是 SA 常有的操作:并查集
从 h 大的开始合并,合并途中算贡献。
详见代码
CODE
#include<vector>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define MAXN 300005
#define MAXC 26
#define LB 'a'
#define LL long long
#define DB double
#define ENDL putchar('\n')
LL read() {
LL f = 1,x = 0;char s = getchar();
while(s < '0' || s > '9') {
if(s=='-')f = -f;s = getchar();}
while(s >= '0' && s <= '9') {
x=x*10+(s-'0');s = getchar();}
return x * f;
}
const int MOD = 1000000007;
int n,m,i,j,s,o,k;
char ss[MAXN];
int a[MAXN];
int sa[MAXN],rk[MAXN],ht[MAXN],h[MAXN];
int rt[MAXN],nx[MAXN],tl[MAXN],pr[MAXN<<1];
int ins(int i,int x,int y) {
return x==0 ? (rt[i]=y):(nx[x]=y);}
void INIT_SUFFIX_ARRAY(char *s,int *sa,int *rk,int n) {
for(int i=1;i<=n;i++)sa[i]=rk[i]=rt[i]=nx[i]=tl[i]=pr[n+i]=0;
for(int i = 1;i <= n;i ++)
nx[tl[0+s[i]] = ins(0+s[i],tl[0+s[i]],i)] = 0;
int cn = 0,nm = 0;
for(int i = 0;i <= 256;i ++) {
int p = rt[i];if(p) nm ++;
while(p) {
sa[++ cn] = p; rk[p] = nm;
if(p == tl[i]) break;
p = nx[p];
} rt[i] = tl[i] = 0;
}
for(int ii = 1;ii <= n;ii <<= 1) {
for(int i = 1;i <= n;i ++) pr[i] = rk[i],rk[i] = 0;
for(int i = n-ii+1;i <= n;i ++)
nx[tl[pr[i]] = ins(pr[i],tl[pr[i]],i)] = 0;
for(int i = 1;i <= n;i ++) {
if(sa[i] <= ii) continue;
nx[tl[pr[sa[i]-ii]] = ins(pr[sa[i]-ii],tl[pr[sa[i]-ii]],sa[i]-ii)] = 0;
}
cn = 0;nm = 0;
for(int i = 1;i <= n;i ++) {
int p = rt[i],pp = 0;
while(p) {
sa[++ cn] = p;
rk[p] = ((!pp || pr[p+ii] != pr[pp+ii]) ? (++nm):nm);
if(p == tl[i]) break;
pp = p;p = nx[p];
} rt[i] = tl[i] = 0;
}
}
return ;
}
void INIT_HEIGHT(char *s,int *sa,int *rk,int *hi,int n) {
hi[0] = 0;
for(int i = 1;i <= n;i ++) {
int k = sa[rk[i]-1];if(!k) {
hi[i]=0;continue;}
hi[i] = max(hi[i-1]-1,0);
while(s[k+hi[i]] == s[i+hi[i]]) hi[i] ++;
}
return ;
}
int fa[MAXN],ct[MAXN];
int Abs(int x) {
return x<0 ? -x:x;}
int findf(int x) {
return x==fa[x] ? x:(fa[x] = findf(fa[x]));}
int unionSet(int a,int b) {
int u = findf(a),v = findf(b),re = 0;
if(ct[u]*1ll*ct[v] > 0) re = 0;
else re = min(Abs(ct[u]),Abs(ct[v]));
ct[v] = ct[u] + ct[v];
fa[u] = v; return re;
}
vector<int> c[MAXN];
int main() {
n = read();m = read();
scanf("%s",ss + 1);
ss[n+1] = '#';
scanf("%s",ss + n + 2);
int N = (n<<1|1);
INIT_SUFFIX_ARRAY(ss,sa,rk,N);
INIT_HEIGHT(ss,sa,rk,ht,N);
for(int i = 1;i <= N;i ++) h[i] = ht[sa[i]];
for(int i = 1;i <= N;i ++) {
fa[i] = i;ct[i] = 0;
if(sa[i] <= n-m+1) ct[i] = 1;
else if(sa[i] > n+1 && sa[i] <= N-m+1) ct[i] = -1;
if(i-1) c[h[i]].push_back(i);
}
LL ans = (n-m+1) *1ll* m;
for(int i = n;i >= 0;i --) {
for(int j = 0;j < (int)c[i].size();j ++) {
int t = c[i][j];
ans -= unionSet(t-1,t) *1ll* (min(i,m));
}
}
printf("%lld\n",ans);
return 0;
}