版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_33468963/article/details/64918847
题目:http://www.gdfzoj.com/oj/problem/470
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。.其中 R,B<5000
这是一道 玄学的 动态规划题
用 double f[i][j] 表示 翻开 i 张红牌和 j 张黑牌后的期望值
(当期望值小于0是选择不翻于是 “f[i][j] = max(f[i][j],0);”)
而从 f[i-1][j] 和 f[i][j-1] 转移到 f[i][j] 的可能性分别是 “i / (i+j)”和 “j / (i+j)”
答案就是 f[r][b];
关于这类数学期望题,引用一位神犇的总结:
和的期望就是期望的和
(然而我不懂)
帖代码:(不转double只有95分)
#include <cstdio>
#define max(a,b) (a>b ? a : b)
int r,b,i,j;
double f[5010][5010];
int main() {
scanf("%d%d",&r,&b);
for (i=0;i<=r;i++) for (j=0;j<=b;j++) {
if (i) f[i][j] += (f[i-1][j] + (double)1) / (double)(i+j) * (double)i;
if (j) f[i][j] += (f[i][j-1] - (double)1) / (double)(i+j) * (double)j;
f[i][j] = max(f[i][j],0);
}
printf("%.6lf\n",f[r][b] - 0.0000005);
}