SAM的若干性质:
1、每个节点所代表的后缀一定是连续长度的。
2、x节点代表的[l1,r1],pre[x]代表[l2,r2],其中l1=r2+1。
3、pre指针的包含关系。
4、l排序满足拓扑排序。
spoj1811 LCS
n<=100000 两个串的LCS
做的时候是在好久以前刚刚学完SAM的时候。。
当时naive啊。。好多SAM的性质都没理解上来照猫画虎硬搞。。
之后还给学弟口胡了几句。。。
按照第一个串建立SAM,然后将第二个串在上边匹配,如果匹配成功,ans++;否则,按照pre指针跳,直到匹配成功,ans=l[now]+1;
因为pre指针的包含关系,成功匹配了now,一定可以成功匹配pre[now]。
#include<iostream>
#include<cstdio>
#include<cstring>
#define N 2000005
using namespace std;
int ch[N][26],pre[N],dis[N];
char a[N],b[N];
int sz=0,n,m,p,q,np,nq,now,last,S,ans=0,len=0;
void ins(int x){
p=last;np=++sz;last=sz;
dis[np]=dis[p]+1;
for(;p&&!ch[p][x];p=pre[p]) ch[p][x]=np;
if(!p) {pre[np]=S;return;}
q=ch[p][x];
if(dis[q]==dis[p]+1) pre[np]=q;
else{
nq=++sz;dis[nq]=dis[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
pre[nq]=pre[q];
pre[q]=pre[np]=nq;
for(;ch[p][x]==q;p=pre[p])ch[p][x]=nq;
}
}
void getans(int x){
if(ch[now][x]) len++,now=ch[now][x];
else{
while(now&&!ch[now][x]) now=pre[now];
if(now==0) now=S,len=0;
else len=dis[now]+1,now=ch[now][x];
}
printf("%d\n",len);
}
int main(){
freopen("in.txt","r",stdin);
freopen("out.txt","w",stdout);
scanf("%d %d\n",&n,&m);
scanf("%s\n%s\n",a,b);
now=last=S=++sz;
for(int i=0;i<n;i++) ins(a[i]-'a');
for(int i=0;i<m;i++) getans(b[i]-'a');
return 0;
}
spoj1812 LCS2
求n个串的LCS n<=10,L<=100000
对第一个串建立SAM,然后用剩下的串匹配。
每次匹配,每个节点记录该节点匹配的最长串。然后每个节点需要根据拓扑序更新到pre[x]上。
然后每次更新ans[],记录的是前k个串匹配到i节点的最长长度。显然是对每次的答案去min。
然后最后枚举每个点,更新最终答案即可。
#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<algorithm>
#define N 200005
using namespace std;
int p,q,np,nq,last,S;
char s[11][N];
int l[N],pre[N],ch[N][26];
int n,sz=0;
int ll[N],ans[N],r[N],c[N],len,now,ret;
void ins(int x){
p=last;np=++sz;last=np;
l[np]=l[p]+1;
for(;p&&!ch[p][x];p=pre[p]) ch[p][x]=np;
if(p==0){pre[np]=S;return;}
q=ch[p][x];
if(l[q]!=l[p]+1){
nq=++sz;
l[nq]=l[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
pre[nq]=pre[q];
pre[q]=pre[np]=nq;
for(;ch[p][x]==q;p=pre[p]) ch[p][x]=nq;
}else pre[np]=q;
}
void getans(char *s){
memset(ll,0,sizeof(ll));
now=S;len=0;
for(int i=1;s[i];i++){
int x=s[i]-'a';
if(ch[now][x]) {
len++;now=ch[now][x];
}
else{
for(;now&&!ch[now][x];now=pre[now]);
if(now==0) {len=0;now=S;}
else {len=l[now]+1;now=ch[now][x];}
}
ll[now]=max(len,ll[now]);
}
for(int i=sz;i>=1;i--) if(ll[r[i]]) ll[pre[r[i]]]=l[pre[r[i]]];
for(int i=sz;i>=1;i--) ans[i]=min(ans[i],ll[i]);
}
int main(){
freopen("in.txt","r",stdin);
freopen("out.txt","w",stdout);
n=0;while(scanf("%s",s[++n]+1)!=EOF);n--;
S=last=++sz;
for(int i=1;s[1][i];i++) ins(s[1][i]-'a');
for(int i=1;s[1][i];i++) c[i]=0;
for(int i=1;i<=sz;i++) c[l[i]]++;
for(int i=1;s[1][i];i++) c[i]+=c[i-1];
for(int i=1;i<=sz;i++) r[c[l[i]]--]=i;
memset(ans,127,sizeof(ans));
for(int i=2;i<=n;i++) getans(s[i]);
for(int i=1;i<=sz;i++) if(ret<ans[i]) ret=ans[i];
printf("%d\n",ret);
return 0;
}
spoj8222
给定字符串s,求f[1..n],表示出现i次的字符串的最大长度。n<=100000
建立后缀自动机,然后对于每一个状态所表示的最长子串,我们发现它所出现的次数就在于他的后继中有多少个不同接受态。所以我们用类似基数排序的东西处理出一个拓扑序列,然后自下而上更新pre节点。注意要先对所有主链上的点赋初值1,这是因为这其实等价于对于每次插入后缀的那个节点,而那个节点正是一个合法的接受态。然后一边更新一边统计长度i的最大值f[i]最后又因为我们处理的都是每个状态的最长子串重复次数,所以最后还要再倒着推一次f[i]:=max(f[i],f[i+1])最后输出就行了。
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
#define N 500005
using namespace std;
int l[N],ch[N][26],pre[N],c[N],t[N],v[N],dp[N];
int S,last,now,sz;
char s[N];
void ins(int x){
int p=last;int np=++sz;last=np;
l[np]=l[p]+1;
for(;p&&!ch[p][x];p=pre[p]) ch[p][x]=np;
if(p==0) {pre[np]=S;return;}
int q=ch[p][x];
if(l[q]==l[p]+1) pre[np]=q;
else{
int nq=++sz;
l[nq]=l[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
pre[nq]=pre[q];
pre[q]=pre[np]=nq;
for(;ch[p][x]==q;p=pre[p]) ch[p][x]=nq;
}
}
int main(){
S=last=now=++sz;
scanf("%s",s+1);int n=strlen(s+1);
for(int i=1;i<=n;i++) ins(s[i]-'a');
for(int i=1;i<=n;i++) printf("%d ",pre[i]);
for(int i=1;i<=n;i++) c[i]=0;
for(int i=1;i<=sz;i++) c[l[i]]++;
for(int i=1;i<=n;i++) c[i]+=c[i-1];
for(int i=1;i<=sz;i++) t[c[l[i]]--]=i;
for(int i=1;i<=n;i++){
now=ch[now][s[i]-'a'];
v[now]=1;
}
for(int i=sz;i;i--){
now=t[i];
v[pre[now]]+=v[now];
dp[l[now]]=max(dp[l[now]],v[now]);
}
for(int i=n;i;i--)
dp[i]=max(dp[i+1],dp[i]);
for(int i=1;i<=n;i++) printf("%d\n",dp[i]);
system("pause");
}
待更。