极小化极大和动态规划之间的故事 2

今天我们继续上次没有讲完的故事。

1 我能赢吗

Leetcode 464：

    在 "100 game" 这个游戏中，两名玩家轮流选择从 1 到 10 的任意整数，累计
整数和，先使得累计整数和达到 100 的玩家，即为胜者。
    如果我们将游戏规则改为 “玩家不能重复使用整数” 呢？
    例如，两个玩家可以轮流从公共整数池中抽取从 1 到 15 的整数（不放回），直
到累计整数和 >= 100。
    给定一个整数 maxChoosableInteger （整数池中可选择的最大数）和另一个整数
 desiredTotal（累计和），判断先出手的玩家是否能稳赢（假设两位玩家游戏时都表
 现最佳）？
    你可以假设 maxChoosableInteger 不会大于 20， desiredTotal 不会大于 
300。

示例：
输入：
maxChoosableInteger = 10
desiredTotal = 11
输出：
false

解释：
    无论第一个玩家选择哪个整数，他都会失败。
    第一个玩家可以选择从 1 到 10 的整数。
    如果第一个玩家选择 1，那么第二个玩家只能选择从 2 到 10 的整数。
    第二个玩家可以通过选择整数 10（那么累积和为 11 >= desiredTotal），从而
取得胜利.
    同样地，第一个玩家选择任意其他整数，第二个玩家都会赢。

很显然，这又是一个极小化极大的问题。之前已经提到过，极小化极大往往会重复计算很多次，就比如这道题，先手拿走1后手拿走2，和先手拿走2后手拿走1，是完全等价的。因此，为了避免重复计算，我们需要把“1和2已经被拿走”这个状态以及它的答案（先手能否稳赢）记录下来。但这就有一个问题，题目条件是整数池的大小 maxChoosableInteger 不大于20，也就是说整个动态规划空间最高会达到20维，这显然是不可接受的。因为这个，之前还犯了一个错误，就是我误以为只需要记录整数池内所有剩下数的和就可以了，如果是这样可行的话，那么动态规划空间就是一维的，但后来发现这是不可行的，因为整数池内还剩下1和2，和还剩下3的状态显然是不能等价的，但是它们的和都是3，因此不能只记录整数池内剩下整数的和。

既然动态空间的维度过高，现在就要想办法对状态进行压缩了。 对于一个数字来说，它只有两种状态：在整数池内，或不在。因此只需要一个比特，而非一个int型，就可以表示一个数的所有状态。而整数池最多有20个数，int型是32位，因此只需要一个int型，就可以表示所有数的所有状态。

对状态进行压缩以后，就可以写代码了。值得注意的是，当整数池内的所有数之和比目标数还要小的时候，两个玩家都无法获胜，这种情况也属于先手无法获胜，因此也要返回false。 这道题实现的代码如下：

class Solution 
{
public:
    bool canIWin(int maxChoosableInteger, int desiredTotal) 
    {
        int state = 0;
        map<int, int> hash;
        return minMax(maxChoosableInteger, desiredTotal, state, hash);
    }
    bool minMax(int maxChoosableInteger, int desiredTotal, int state, 
        map<int, int>& hash)
    {
        if (hash[state] == 1) { return true; }
        if (hash[state] == -1) { return false; }
        if (stateToSum(state, maxChoosableInteger) < desiredTotal) 
        { 
        	return false; 
        }

        int new_state;
        for (int i = 0; i < maxChoosableInteger; ++i)
        {
            if (!(state & (1 << i))) 
            {
                if (i + 1 >= desiredTotal) 
                { 
                	return hash[state] = true; 
                }
                new_state = state + (1 << i);
                hash[new_state] = minMax(maxChoosableInteger, 
                    desiredTotal - (i + 1), new_state, hash);
                if (!hash[new_state]) 
                { 
                	return hash[state] = true;
                }
            }
        }
        return hash[state] = false;
    }
    int stateToSum(int state, int maxChoosableInteger)
    {
        int ans = 0;
        for (int i = 0; i < maxChoosableInteger; ++i)
        {
            if (!(state & (1 << i))) 
            { 
            	ans += i + 1; 
            }
        }
        return ans;
    }
};

2 预测赢家

Leetcode 486：

    给定一个表示分数的非负整数数组。 玩家1从数组任意一端拿取一个分数，随后玩
家2继续从剩余数组任意一端拿取分数，然后玩家1拿，……。每次一个玩家只能拿取一个
分数，分数被拿取之后不再可取。直到没有剩余分数可取时游戏结束。最终获得分数总
和最多的玩家获胜。
    给定一个表示分数的数组，预测玩家1是否会成为赢家。你可以假设每个玩家的玩法
都会使他的分数最大化。

示例 1:
输入: [1, 5, 2]
输出: False
解释: 一开始，玩家1可以从1和2中进行选择。
如果他选择2（或者1），那么玩家2可以从1（或者2）和5中进行选择。如果玩家2选择
了5，那么玩家1则只剩下1（或者2）可选。
所以，玩家1的最终分数为 1 + 2 = 3，而玩家2为 5。
因此，玩家1永远不会成为赢家，返回 False。

示例 2:
输入: [1, 5, 233, 7]
输出: True
解释: 玩家1一开始选择1。然后玩家2必须从5和7中进行选择。无论玩家2选择了哪个，
玩家1都可以选择233。
最终，玩家1（234分）比玩家2（12分）获得更多的分数，所以返回 True，表示玩家1
可以成为赢家。

注意:
1 <= 给定的数组长度 <= 20.
数组里所有分数都为非负数且不会大于10000000。
如果最终两个玩家的分数相等，那么玩家1仍为赢家。

其实如果做过另一道题 leetcode 877：石子游戏的话，就可以看出这个题是那道题的更一般情况，因此这里不再赘述，请参阅另一篇博客https://blog.csdn.net/weixin_43590611/article/details/104009097

实现代码如下：

class Solution 
{
public:
    bool PredictTheWinner(vector<int>& nums) 
    {
        int n = nums.size();
        vector<int> dp(nums);
        for (int len = 1; len < n; ++len)
        {
            for (int i = 0; i + len < n; ++i)
            {
                dp[i] = max(nums[i] + sum(i + 1, i + len, nums) - dp[i + 1],
                    nums[i + len] + sum(i, i + len - 1, nums) - dp[i]);
            }
        }
        return dp[0] * 2 >= accumulate(nums.begin(), nums.end(), 0);
    }
    int sum(int i, int j, vector<int>& nums)
    {
        return accumulate(nums.begin() + i, nums.begin() + j + 1, 0);
    }
};

3 猜数字大小2

Leetcode 375：

    我们正在玩一个猜数游戏，游戏规则如下：
    我从 1 到 n 之间选择一个数字，你来猜我选了哪个数字。
    每次你猜错了，我都会告诉你，我选的数字比你的大了或者小了。
    然而，当你猜了数字 x 并且猜错了的时候，你需要支付金额为 x 的现金。直到你
猜到我选的数字，你才算赢得了这个游戏。

示例:
n = 10, 我选择了8.
第一轮: 你猜我选择的数字是5，我会告诉你，我的数字更大一些，然后你需要支付5块。
第二轮: 你猜是7，我告诉你，我的数字更大一些，你支付7块。
第三轮: 你猜是9，我告诉你，我的数字更小一些，你支付9块。
游戏结束。8 就是我选的数字。
你最终要支付 5 + 7 + 9 = 21 块钱。

给定 n ≥ 1，计算你至少需要拥有多少现金才能确保你能赢得这个游戏。

这个题和典型的二分查找有点类似，不过不同之处在于这次我们要使得花的钱最少，而非查找次数最少。因此我们不能简单地每次都猜某个范围的中位数。至于具体猜哪个，最后花的钱最少，这是无法事先计算的，只能把这个范围内猜数的所有情况的花费都算出来，再进行比较，取最小值，才能得到最佳策略。值得注意的是，猜一个数，有可能出现目标与它相等，目标比它大，目标比它小三种情况，而猜某个数的的花费，应该是猜这个数之后可能出现的三种情况中，花费最大的那个。实现的代码如下：

class Solution 
{
public:
    int getMoneyAmount(int n) 
    {   
        vector<vector<int> > dp(n + 1, vector<int> (n + 1, -1));
        dynamicPro(1, n, dp);
        return dp[1][n];
    }
    int dynamicPro(int left, int right, vector<vector<int> >& dp)
    {
        if (left > right) { return 0; }
        if (dp[left][right] != -1) { return dp[left][right]; }
        if (left == right) { return dp[left][right] = 0; }
        int res = INT_MAX;
        for (int i = left; i <= right; ++i)
        {
            res = min(res, 
                i + max(dynamicPro(left, i - 1, dp), 
                    dynamicPro(i + 1, right, dp)));
        }
        return dp[left][right] = res;
    }
};

更多精彩内容，敬请期待。

小狗过河

发布了20 篇原创文章 · 获赞 4 · 访问量 1094

私信关注