Description
基因串是由ACGT4个字母组成的,我们有一个长度为n的基因串S。想要知道长度为m的基因串中,与S的最长公共子序列分别为0; 1; ; n的串各有几个。
输出答案关于10^9 + 7的余数。
Input
第一行一个字符串S。第二行一个正整数m。
Output
n + 1行,第i + 1行表示与S公共子序列为i的串有几个关于10^9 + 7的余数。
Sample Input
GTC
10
Sample Output
1
22783
528340
497452
Data Constraint
10%的数据n <= 3;m <= 10。
50%的数据n <= 6;m <= 100。
100%的数据n <= 10;m <= 1000。
思路
我们可以考虑对于求两个串的最长公共子序列的dp:f[i,j]代表第一个串到了i,第二个串到了j的最长公共子序列。对于两个串来说,如果数组f[i]是完全一样的,则它们对后面的影响也是完全一样的,所以我们可以设2维状态:F[i,j]代表我们当前以及到了i,f[i]的状态为j的方案数,但是这样设状态第二维有1010。我们发现一个f[i,j]一定不会比f[i,j-1]小,且最多比f[i,j-1]多1,所以我们在设状态的时候可以取个差值,就变成210。
代码
#include<bits/stdc++.h>
using namespace std;
const int MAXN = 1050,Mo = 1000000007;
char s[12];
int f[MAXN][MAXN],s1[12],F[12],Nt[12],No[12],N,M;
int max(int a,int b) {return a > b ? a : b;}
int main()
{
scanf("%s",s);
N = strlen(s);
for(int i = 0;i < N;i ++)
if (s[i] == 'A') s1[i + 1] = 1; else if (s[i] == 'C') s1[i + 1] = 2; else
if (s[i] == 'G') s1[i + 1] = 3; else s1[i + 1] = 4;
scanf("%d", &M);
f[0][0] = 1;
for(int i = 0;i < M;i ++)
for(int j = 0;j < (1 << N);j ++)
if (f[i][j])
for(int z = 1;z <= 4;z ++)
{
for(int k = 1;k <= N;k ++) Nt[k] = 0;
for(int tmp = j,k = 0;tmp;tmp /= 2) Nt[N - (++ k) + 1] = tmp % 2;
for(int p = 1;p <= N;p ++) Nt[p] += Nt[p - 1];
int tmp = 0;
for(int k = 1;k <= N;k ++)
{
No[k] = max(No[k - 1],Nt[k]);
if (z == s1[k]) No[k] = max(No[k],Nt[k - 1] + 1);
tmp = tmp * 2 + (No[k] - No[k - 1]);
}
f[i + 1][tmp] = (f[i + 1][tmp] + f[i][j]) % Mo;
}
for(int i = 0;i < (1 << N);i ++)
{
int c = 0;for(int tmp = i;tmp;tmp /= 2) c += tmp % 2;
F[c] = (F[c] + f[M][i]) % Mo;
}
for(int i = 0;i <= N;i ++) printf("%d\n",F[i]);
}