状态: O ( d p [ i ] ) O(dp[i]) O(dp[i]) 表示从下标 i i i开始到结束当前先手的人能取到的最大值。
DP方程: d p [ i ] = m a x ( d p [ i ] , s [ i , i + k − 1 ] + s [ i + k , n − 1 ] − d p [ i + k ] ) dp[i] = max(dp[i],s[i,i+k-1] + s[i+k,n-1]-dp[i+k] ) dp[i]=max(dp[i],s[i,i+k−1]+s[i+k,n−1]−dp[i+k]) 极其重要的一点思想,因为对于当前先手的人的下一个人也会遇到和先手的人相同的选择策略,所以当先手的人选择了k个石子堆后,对于后面剩余的石子堆他还能获得的石子堆的个数其实是后面的石子总数减去后手的人能获得的最大值。
注意点:注意石子堆对应的分数有正有负,所以 d p [ ] dp[] dp[]初始化为无穷小。其次又因为每次不能一个都不选,所以要多一个 d p [ n ] = 0 dp[n] =0 dp[n]=0的边界。