题意:给出两个字符串,求出它们的最长公共子串(Longest Common Substring)
分析:
如果两个串的长度在1e3的话,可以直接DP。但是这道题的长度在1e5,一定会超时加爆内存,改变思路。发现hash可以做,同时需要两次二分,第一次二分LCS的长度,第二次二分查找是否有满足的值。
时间复杂度:
空间复杂度:
AC代码:
#include<stdio.h>
#include<vector>
#include<algorithm>
#include<string.h>
#define hash HASH
using namespace std;
typedef unsigned long long ull;
const int maxn = 1e5+100;
const ull p = 29;
int n,m;
char a[maxn],b[maxn];
ull ha[maxn],hb[maxn],base[maxn];
vector<ull> vec;
void init(){
base[0] = 1LL;
for(int i = 1;i<maxn;++i)
base[i] = base[i-1] * p;
}
void gethash(){
ha[0] = a[0] - 'A' + 1;
for(int i=1;i<n;++i){
ha[i] = ha[i-1]*p + a[i] - 'A' + 1;
}
// for(int i=0;i<n;++i) printf("%llu%c",ha[i],(i==n-1)?'\n':' ');
hb[0] = b[0] - 'A' + 1;
for(int i=1;i<m;++i){
hb[i] = hb[i-1]*p + b[i] - 'A' + 1;
}
// for(int i=0;i<m;++i) printf("%llu%c",hb[i],(i==m-1)?'\n':' ');
}
bool solve(int x){
vec.clear();
for(int i=x-1;i<n;++i){
ull t = ha[i] - ha[i-x]*base[x];
vec.push_back(t);
}
sort(vec.begin(),vec.end());
for(int i=x-1;i<m;++i){
ull t = hb[i] - hb[i-x]*base[x];
if(binary_search(vec.begin(),vec.end(),t)) return 1; //二分查找vec中是否存在 t
}
return 0;
}
int main(){
init();
// int T;
// scanf("%d",&T);
// while(T--){
//
// }
scanf("%s %s",a,b);
n = strlen(a);
m = strlen(b);
gethash();
int l = 0, r = min(n,m),mid,ans;
while(l<=r){ //二分LCS的长度
mid = (l+r)>>1;
if(solve(mid)){
ans = mid;
l = mid + 1;
}
else r = mid - 1;
}
printf("%d\n",ans);
return 0;
}
看别人都是用后缀数组做的,不过还没学,待补。。。