子序列的个数

给定一个正整数序列，序列中元素的个数和元素值大小都不超过105, 求其所有子序列的个数。注意相同的只算一次：例如 {1,2,1}有子序列{1} {2} {1,2} {2,1}和{1,2,1}。最后结果对10^9 + 7取余数。

分析：万能枚举，时间复杂度O(2^n)——因为每一项都可以选择取或者不取嘛。这个不可行，n太大了。

我们想想动态规划？严格来讲这个题不是一个dp的问题，因为它是一个数数（组合数学）的问题，不是一个优化的问题。我们来想想2^n个子序列是怎么来的——之前已经有2^(n-1)个了，再加上最后一个或者不加上最后一个，还有两种选择。

假设dp[i]表示前i项形成的子序列（含空）的个数。下标从1开始，初值是dp[0] = 1，对应代表空子序列。我们考虑第i项，如果所有的数都不相等，应该有dp[i] = dp[i – 1] * 2，其实就是考虑把第i个数放到最后或者不放到最后的情况。

然而，因为有可能有相同的数，我们假设第i个数出现之前最近的在j (j < i)位置也出现过，那么实际上我们这种简单＊2会有重复，哪些子序列重复呢？我们设数列为a, 并且下标从1开始。

原来恰好以第j个数结尾的那些被我们算了两次，因为以第j个数结尾可以换成以第i个数结尾是一样的。如何计算出这个数的个数呢？其实这个数等于dp[j – 1]，因为前面(j – 1)个数的子序列最后跟上第j个数就可以了。

于是我们有了递推式：

dp[i] = dp[i – 1] * 2 如果a[i]不在之前出现
dp[i] = dp[i – 1] * 2 – dp[j – 1]，如果a[i]最近在j的位置出现过。

这里有一个问题：我们如何找到a[i]最近在哪里出现呢？我们可以用一个hash，更简单的方式是直接把a[i]放到数组下标里，记录它最后一次出现的位置，因为数据范围并不大，可以承受。所以我们有了一个时间复杂度O(n)的动态规划解法。

注意最后答案是dp[n] – 1 因为我们需要减掉一个全空子序列。

伪代码：

dp[0] = 1
for  i = 1 to n do
	dp[i] = dp[i – 1] * 2
	if have[a[i]] > 0 then dp[i] -= dp[have[a[i]] – 1]
return dp[n] – 1

输入: a[1..n]
辅助变量： have[x]表示目前x在a中最后一次出现的位置，如果没出现就是0，否则是一个正数。

另外，题目为了避免大数运算采用了取余数操作，请别忘记取余数操作。

输入

第1行：一个数N，表示序列的长度(1 <= N <= 100000)
第2 - N + 1行：序列中的元素(1 <= a[i] <= 100000)

输出

输出a的不同子序列的数量Mod 10^9 + 7。

输入示例

4
1
2
3
2
输出示例

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
const int mod=1e9+7;
int mat[100005];
int dp[100005];
int have[100005];
int main()
{
	int n;
	memset(dp,0,sizeof(dp));
	memset(have,0,sizeof(have));
	scanf("%d",&n);
	for(int i=1;i<=n;i++) {
		scanf("%d",&mat[i]);
	}
	dp[0]=1;//初始化，空串 
	for(int i=1;i<=n;i++) {
		dp[i]=dp[i-1]*2%mod;//不能加mod后在%mod,会超int 
		if(have[mat[i]]) {
			dp[i]=(dp[i]-dp[have[mat[i]]-1]+mod)%mod;
		}
		have[mat[i]]=i;//每次只记录前一次出现的位置就行 
	}
	printf("%d\n",dp[n]-1);//空串计算两次，减一
	return 0;
}

子序列的个数

子序列的个数

猜你喜欢