poj3294 Life Forms (后缀数组模板)

链接

http://poj.org/problem?id=3294

题解

把所有的串连接起来,然后二分串的长度 K
检验就是按照 K 分组,使得同一个组内的 h e i g h t 值都大于等于 K ,统计是否存在一个组,这个组包含了大于 n 2 个字符串中的元素,如果存在返回 t r u e

模板

这个模板是很成熟的版本

bool cmp(int *r, int a, int b, int l){return r[a]==r[b] and r[a+l]==r[b+l];}
void build_sa(int *r, int n, int m)
{
    n++; 
    int i, j, k=0, p, *x=wa, *y=wb, *t;
    for(i=0;i<m;i++)ws[i]=0;
    for(i=0;i<n;i++)ws[x[i]=r[i]]++;
    for(i=1;i<m;i++)ws[i]+=ws[i-1];
    for(i=n-1;i>=0;i--)sa[--ws[x[i]]]=i;
    for(p=j=1;p<n;j<<=1,m=p)
    {
        for(p=0,i=n-j;i<n;i++)y[p++]=i;
        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
        for(i=0;i<n;i++)wv[i]=x[y[i]];
        for(i=0;i<m;i++)ws[i]=0;
        for(i=0;i<n;i++)ws[wv[i]]++;
        for(i=1;i<m;i++)ws[i]+=ws[i-1];
        for(i=n-1;i>=0;i--)sa[--ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,i=1,x[sa[0]]=0;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
    for(i=0;i<n;i++)rank[sa[i]]=i;
    for(i=0;i<n-1;height[rank[i++]]=k)
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}

其中build_sa(int *r, int n, int m)的作用是对 r 这个数组构造后缀数组, r 中有 r [ 0 ] . . . r [ n 1 ] n 个元素,且必须满足 r [ n ] = 0 (否则会出错), m 是一个比较宽的上界(必须有所预留),传进去的 r 数组的元素不能等于 0 或者小于 0
该函数执行完之后,构造出 s a [ 0... n ] , r a n k [ 0... n ] , h e i g h t [ 0... n ]

代码

#include <cstdio>
#include <algorithm>
#include <cstring>
#define maxn 200000
#define cl(x) memset(x,0,sizeof(x))
using namespace std;
int N, r[maxn], wa[maxn], wv[maxn], ws[maxn], wb[maxn], cnt[110], belong[maxn], L, tot, sa[maxn], rank[maxn], height[maxn];
char s[maxn];
struct substr
{
    int rank, len;
}list[maxn];
bool cmp(int *r, int a, int b, int l){return r[a]==r[b] and r[a+l]==r[b+l];}
void build_sa(int *r, int n, int m)
{
    n++; 
    int i, j, k=0, p, *x=wa, *y=wb, *t;
    for(i=0;i<m;i++)ws[i]=0;
    for(i=0;i<n;i++)ws[x[i]=r[i]]++;
    for(i=1;i<m;i++)ws[i]+=ws[i-1];
    for(i=n-1;i>=0;i--)sa[--ws[x[i]]]=i;
    for(p=j=1;p<n;j<<=1,m=p)
    {
        for(p=0,i=n-j;i<n;i++)y[p++]=i;
        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
        for(i=0;i<n;i++)wv[i]=x[y[i]];
        for(i=0;i<m;i++)ws[i]=0;
        for(i=0;i<n;i++)ws[wv[i]]++;
        for(i=1;i<m;i++)ws[i]+=ws[i-1];
        for(i=n-1;i>=0;i--)sa[--ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,i=1,x[sa[0]]=0;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
    for(i=0;i<n;i++)rank[sa[i]]=i;
    for(i=0;i<n-1;height[rank[i++]]=k)
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}
void init()
{
    int i, p=0, j, l;
    tot=0, cl(r), cl(rank), cl(sa), cl(wa), cl(wb), cl(belong);
    for(i=1;i<=N;i++)
    {
        scanf("%s",s);
        l=strlen(s);
        for(j=0;j<l;j++)r[p+j]=s[j], belong[p+j]=i;
        r[p+l]=1000+i;
        p=p+l+1;
    }
    L=p;
    build_sa(r,L,2000);
}
bool check(int K)
{
    int i, j, pre, c;
    tot=0;
    pre=1;
    for(i=1;i<=L;i++)
        if(height[i+1]<K)
        {
            cl(cnt);
            c=0;
            for(j=pre;j<=i;j++)
                if(r[sa[j]]<1000)
                {
                    cnt[belong[sa[j]]]++;
                    if(cnt[belong[sa[j]]]==1)c++;
                }
            if(c>N>>1)list[++tot]=(substr){pre,K};
            pre=i+1;
        }
    return tot>0;
}
void display(int K)
{
    int i, j;
    check(K);
    for(i=1;i<=tot;i++)
    {
        for(j=0;j<list[i].len;j++)printf("%c",r[sa[list[i].rank]+j]);
        printf("\n");
    }
    if(tot==0)printf("?\n");
    printf("\n");
}
void work()
{
    int l=1, r=1000, mid=(l+r+1)>>1;
    while(l^r)
    {
        if(check(mid))l=mid;
        else r=mid-1;
        mid=(l+r+1)>>1;
    }
    display(l);
}
int main()
{
    for(scanf("%d",&N);N;scanf("%d",&N))
    {
        init();
        work();
    }
    return 0;
}

猜你喜欢

转载自blog.csdn.net/FSAHFGSADHSAKNDAS/article/details/81392813