问题一:求串s1,s2最长公共子串长度
问题二:求串s的最长重复子串
问题三:求串s1,s2最长公共子序列长度
注:两个字符串的最长公共子序列与最长公共子串区别是前者字符之间不一定是连在一块的,而公共子串必须要连在一块。比如字符串1:ABCAB;字符串2:ADEBCFA,则这两个字符串的最长公共子序列为ABCA,最长公共子串是:BC
以上三个问题都可以用三层循环求出,但 时间复杂度为O(n3),如果使用动态规划,那么可以把复杂度降为O(n2)
问题一求解方法:
假设两个字符串分别为s和t,s[i]和t[j]分别表示其第i和第j个字符(字符顺序从0开始)再令L[i, j]表示以s[i]和t[j]为结尾的相同子串的最大长度。应该不难递推出L[i, j]和L[i+1,j+1]之间的关系,因为两者其实只差s[i+1]和t[j+1]这一对字符。若s[i+1]和t[j+1]不同,那么L[i+1, j+1]自然应该是0,因为任何以它们为结尾的子串都不可能完全相同;而如果s[i+1]和t[j+1]相同,那么就只要在以s[i]和t[j]结尾的最长相同子串之后分别添上这两个字符即可,这样就可以让长度增加一位。合并上述两种情况,也就得到L[i+1,j+1]=(s[i]==t[j]?L[i,j]+1:0)这样的关系。最后就是要小心的就是临界位置
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int max;
void f(char s1[],char s2[])
{
int s1_len=strlen((s1));
int s2_len=strlen((s2));
int i,j;
int L[s1_len][s2_len];
for(i=0; i<s1_len; i++)
{
if(s1[i]==s2[0])
L[i][0]=1;
else
L[i][0]=0;
}
for(j=0; j<s2_len; j++)
{
if(s1[0]==s2[j])
L[0][j]=1;
else
L[0][j]=0;
}
for(i=1; i<s1_len; i++)
{
for(j=1; j<s2_len; j++)
{
if(s1[i]==s2[j])
{
L[i][j]=L[i-1][j-1]+1;
}
if(s1[i]!=s2[j])
{
L[i][j]=0;
}
if(L[i][j]>max)
{
max=L[i][j];//记录最长长度
}
}
}
}
int main()
{
char s1[100]="abcd44488888888";
char s2[100]="444abbcd88888888";
max=0;
int i=0;
while(s2[i]!='\0')
{
printf("%c %c\n",s1[i],s2[i]);
i++;
}
printf("**********************************\n");
f(s1,s2);
printf("\nmax=%d\n",max);
return 0;
}
问题二求解方法:
在问题一基础,s1与s2串内容是一样的,且要将第二层j循环起始值换为i+1,因为毕竟是 一个串
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int max;
void f(char s[])
{
int s_len=strlen((s));
int i,j;
int L[s_len][s_len];
for(i=0; i<s_len; i++)
{
if(s[i]==s[0])
L[0][i]=1;
else
L[0][i]=0;
}
for(i=1; i<s_len; i++)
{
for(j=i+1; j<s_len; j++)
{
if(s[i]==s[j])
{
L[i][j]=L[i-1][j-1]+1;
}
if(s[i]!=s[j])
{
L[i][j]=0;
}
if(L[i][j]>max)
{
max=L[i][j];
}
}
}
}
int main()
{
char s[100]="abcd444abcd88";
max=0;
printf("%s\n",s);
printf("**********************************\n");
f(s);
printf("\nmax=%d\n",max);
return 0;
}
问题三求解方法:
假设两个字符串分别为s和t,s[i]和t[j]分别表示其第i和第j个字符(字符顺序从0开始)再令L[i, j]表示以s[i]和s[j]为结尾的相同子串的最大长度。应该不难递推出L[i, j]和L[i+1,j+1]之间的关系,因为两者其实只差s[i+1]和t[j+1]这一对字符。若s[i+1]和t[j+1]不同,那么L[i+1, j+1]自然应该是0,因为任何以它们为结尾的子串都不可能完全相同;而如果s[i+1]和t[j+1]相同,那么就只要在以s[i]和t[j]结尾的最长相同子串之后分别添上这两个字符即可,这样就可以让长度增加一位。合并上述两种情况,也就得到L[i+1,j+1]=(s[i]==t[j]?L[i,j]+1:max(c[i-1][j],c[i][j-1]))这样的关系。最后就是要小心的就是临界位置
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int max;
int Max(int a,int b)
{
if(a>=b)
return a;
else
return b;
}
void f(char s1[],char s2[])
{
int s1_len=strlen((s1));
int s2_len=strlen((s2));
int i,j;
int L[s1_len][s2_len];
for(i=0; i<s1_len; i++)
{
if(s1[i]==s2[0])
L[i][0]=1;
else
L[i][0]=0;
}
for(j=0; j<s2_len; j++)
{
if(s1[0]==s2[j])
L[0][j]=1;
else
L[0][j]=0;
}
for(i=1; i<s1_len; i++)
{
for(j=1; j<s2_len; j++)
{
if(s1[i]==s2[j])
{
L[i][j]=L[i-1][j-1]+1;
}
if(s1[i]!=s2[j])
{
L[i][j]=Max(L[i-1][j],L[i][j-1]);;
}
if(L[i][j]>max)
{
max=L[i][j];//记录最长长度
}
}
}
}
int main()
{
char s1[100]="abcd44488888888";
char s2[100]="444abbcd88888888";
max=0;
int i=0;
printf("%s\n%s\n",s1,s2);
printf("**********************************\n");
f(s1,s2);
printf("\nmax=%d\n",max);
return 0;
}