对于博弈型dp,一般是从复杂走向简单,故不从最后一步开始分析,反而从第一部开始分析
问题:一排N个硬币,两人先后从最右边取一个或两个硬币,规定取走最后石子的人为胜。
问先手是否必胜(先手必胜:True;先手必败:False)
例:
N = 5
输出:True,先手必胜,第一个人先取两个石子,无论后手怎么取,最终都是先手拿到最后的石子
问题分析:
要求面对N个石子,是否先手必胜
需要知道面对N-1和N-2个石子,是否先手必胜
子问题:
设f[i]表示对面i个石子,是否先手必胜(f[i] = True/False)
f[i] = True , f[i-1] = False and f[i-2] = False ;拿一颗石子或两颗石子都输
True , f[i-1] = False and f[i-2] = True ;拿一颗石子输拿两颗石子赢
True , f[i-1] = True and f[i-2] = False ;拿一颗石子赢,拿两颗石子输
False , f[i-1] = True and f[i-2] = True ;拿一颗石子或两颗石子都赢
其实就是:对于对面i颗石子的人来说,只要你拿一颗或者两颗石子对手都赢,则你必输。故:
f[i] = False if f[i-1] = True and f[i-2] = True else True
初始条件:
f[0] = False,面对0颗石子,先手什么也不能做,必败
f[1] = f[2] = True
转移方程:
f[i] = False if f[i-1] = True and f[i-2] = True else True
计算顺序:
f[0]....f[N]
时间复杂度O(N),空间复杂度O(N)
代码及注释如下:
def take_coins(N):
if N == 0:
return False
if N <=2 :
return True
#f[1] = f[2] = True
f = [True for i in range(N+1)]
for i in range(3,N+1):
f[i] = False if f[i-1] == True and f[i-2] == True else True
return f[N]
N = 5
print(take_coins(N))
#结果:True,即必胜