Long Long Message 【POJ - 2774】【后缀数组模板】

题目链接


  题意就是找两个字符串中最大相同子串。

  总结一些写后缀数组的经验教训吧,第一次写,就WA了10+次,一是没有考虑到桶排不是只有字符串中字符的个数,而是会扩展到字符串的长度,所以在这里的时候我不能只开128,应该去开到N的长度。再者,就是对于height数组的处理,height求的是lcp(i, i-1),其中,i和i-1是对应的sa[i]和sa[i-1],所以在字符串中的位置仍然是要返回rk[]来进行判断的。

#include <iostream>
#include <cstdio>
#include <cmath>
#include <string>
#include <cstring>
#include <algorithm>
#include <limits>
#include <vector>
#include <stack>
#include <queue>
#include <set>
#include <map>
#include <bitset>
//#include <unordered_map>
//#include <unordered_set>
#define lowbit(x) ( x&(-x) )
#define pi 3.141592653589793
#define e 2.718281828459045
#define INF 0x3f3f3f3f
#define HalF (l + r)>>1
#define lsn rt<<1
#define rsn rt<<1|1
#define Lson lsn, l, mid
#define Rson rsn, mid+1, r
#define QL Lson, ql, qr
#define QR Rson, ql, qr
#define myself rt, l, r
using namespace std;
typedef unsigned long long ull;
typedef unsigned int uit;
typedef long long ll;
const int maxN = 2e5 + 7;
struct SA
{
    int n, m;
    char s[maxN];
    int y[maxN], x[maxN], c[maxN], sa[maxN], rk[maxN], height[maxN];
    inline void get_SA()
    {
        for(int i=1; i<=m; i++) c[i] = 0;   //桶的初始化
        for(int i=1; i<=n; i++) ++c[x[i] = s[i]];
        for(int i=2; i<=m; i++) c[i] += c[i - 1];   //利用差分前缀和的思想知道每个关键字最多是在第几名
        for(int i=n; i>=1; i--) sa[c[x[i]]--] = i;
        for(int k=1; k<=n; k<<=1)
        {
            int num = 0;
            for(int i=n - k + 1; i<=n; i++) y[++num] = i;
            for(int i=1; i<=n; i++) if(sa[i] > k) y[++num] = sa[i] - k; //是否可以作为第二关键字
            for(int i=1; i<=m; i++) c[i] = 0;
            for(int i=1; i<=n; i++) c[x[i]]++;  //因为上一次循环已经求出这次的第一关键字了
            for(int i=2; i<=m; i++) c[i] += c[i - 1];
            for(int i=n; i>=1; i--) //在同一第一关键字下,按第二关键字来排
            {
                sa[c[x[y[i]]]--] = y[i];
                y[i] = 0;
            }
            swap(x, y);
            x[sa[1]] = 1; num = 1;
            for(int i=2; i<=n; i++)
            {
                x[sa[i]] = (y[sa[i]] == y[sa[i - 1]] && y[sa[i] + k] == y[sa[i - 1] + k]) ? num : ++num;
            }
            if(num == n) break;
            m = num;
        }
    }
    inline void get_height()
    {
        int k = 0;
        for(int i=1; i<=n; i++) rk[sa[i]] = i;
        for(int i=1; i<=n; i++)
        {
            if(rk[i] == 1) continue;    //第一名的height为0
            if(k) k--;  //height[i] >= height[i - 1] - 1
            int j = sa[rk[i] - 1];
            while(j + k <= n && i + k <= n && s[i + k] == s[j + k]) k++;
            height[rk[i]] = k;
        }
    }
} sa;
int N, M, init_N, init_M, N_mid;
char s[maxN], model[maxN];
int main()
{
    while(scanf("%s", s + 1) != EOF)
    {
        scanf("%s", model + 1);
        init_N = N = (int)strlen(s + 1);
        init_M = M = (int)strlen(model + 1);
        s[++N] = (char)127;
        N_mid = N;
        for(int i=1; i<=M; i++)
        {
            s[++N] = model[i];
        }
        sa.n = N;
        for(int i=1; i<=sa.n; i++) sa.s[i] = s[i];
        sa.m = 128;
        sa.get_SA();
//        for(int i=1; i<=N; i++) printf("%d ", sa.sa[i]); puts("");
        sa.get_height();
//        for(int i=1; i<=N; i++) printf("%d ", sa.height[i]); puts("");
        int ans = 0;
//        for(int i=init_N + 2; i<=N; i++)
//        {
//            if(sa.sa[sa.rk[i] - 1] >= 1 && sa.sa[sa.rk[i] - 1] <= init_N) ans = max(ans, sa.height[sa.rk[i]]);
//            if(sa.sa[sa.rk[i] + 1] >= 1 && sa.sa[sa.rk[i] + 1] <= init_N) ans = max(ans, sa.height[sa.rk[i] + 1]);
//        }
        for(int i=2; i<=N; i++)
        {
            if((sa.sa[i] < N_mid && sa.sa[i - 1] > N_mid) || (sa.sa[i] > N_mid && sa.sa[i - 1] < N_mid)) ans = max(ans, sa.height[i]);
        }
        printf("%d\n", ans);
    }
    return 0;
}
发布了722 篇原创文章 · 获赞 891 · 访问量 7万+

猜你喜欢

转载自blog.csdn.net/qq_41730082/article/details/103903076