子序列的个数
给定一个正整数序列,序列中元素的个数和元素值大小都不超过105, 求其所有子序列的个数。注意相同的只算一次:例如 {1,2,1}有子序列{1} {2} {1,2} {2,1}和{1,2,1}。最后结果对10^9 + 7取余数。
分析: 万能枚举,时间复杂度O(2^n)——因为每一项都可以选择取或者不取嘛。这个不可行,n太大了。
我们想想动态规划?严格来讲这个题不是一个dp的问题,因为它是一个数数(组合数学)的问题,不是一个优化的问题。我们来想想2^n个子序列是怎么来的——之前已经有2^(n-1)个了,再加上最后一个或者不加上最后一个,还有两种选择。
假设dp[i]表示前i项形成的子序列(含空)的个数。下标从1开始,初值是dp[0] = 1,对应代表空子序列。我们考虑第i项,如果所有的数都不相等,应该有dp[i] = dp[i – 1] * 2,其实就是考虑把第i个数放到最后或者不放到最后的情况。
然而,因为有可能有相同的数,我们假设第i个数出现之前最近的在j (j < i)位置也出现过,那么实际上我们这种简单*2会有重复,哪些子序列重复呢? 我们设数列为a, 并且下标从1开始。
原来恰好以第j个数结尾的那些被我们算了两次,因为以第j个数结尾可以换成以第i个数结尾是一样的。如何计算出这个数的个数呢? 其实这个数等于dp[j – 1],因为前面(j – 1)个数的子序列最后跟上第j个数就可以了。
于是我们有了递推式:
dp[i] = dp[i – 1] * 2 如果a[i]不在之前出现
dp[i] = dp[i – 1] * 2 – dp[j – 1],如果a[i]最近在j的位置出现过。
这里有一个问题:我们如何找到a[i]最近在哪里出现呢?我们可以用一个hash,更简单的方式是直接把a[i]放到数组下标里,记录它最后一次出现的位置,因为数据范围并不大,可以承受。 所以我们有了一个时间复杂度O(n)的动态规划解法。
注意最后答案是dp[n] – 1 因为我们需要减掉一个全空子序列。
伪代码:
dp[0] = 1
for i = 1 to n do
dp[i] = dp[i – 1] * 2
if have[a[i]] > 0 then dp[i] -= dp[have[a[i]] – 1]
return dp[n] – 1
输入: a[1..n]
辅助变量: have[x]表示目前x在a中最后一次出现的位置,如果没出现就是0,否则是一个正数。
另外,题目为了避免大数运算采用了取余数操作,请别忘记取余数操作。
输入
第1行:一个数N,表示序列的长度(1 <= N <= 100000)
第2 - N + 1行:序列中的元素(1 <= a[i] <= 100000)
输出
输出a的不同子序列的数量Mod 10^9 + 7。
输入示例
4
1
2
3
2
输出示例
13
#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
const int mod=1e9+7;
int mat[100005];
int dp[100005];
int have[100005];
int main()
{
int n;
memset(dp,0,sizeof(dp));
memset(have,0,sizeof(have));
scanf("%d",&n);
for(int i=1;i<=n;i++) {
scanf("%d",&mat[i]);
}
dp[0]=1;//初始化,空串
for(int i=1;i<=n;i++) {
dp[i]=dp[i-1]*2%mod;//不能加mod后在%mod,会超int
if(have[mat[i]]) {
dp[i]=(dp[i]-dp[have[mat[i]]-1]+mod)%mod;
}
have[mat[i]]=i;//每次只记录前一次出现的位置就行
}
printf("%d\n",dp[n]-1);//空串计算两次,减一
return 0;
}