极小化极大和动态规划之间的故事 2

极小化极大和动态规划之间的故事 2

今天我们继续上次没有讲完的故事。

1 我能赢吗

Leetcode 464:

    在 "100 game" 这个游戏中,两名玩家轮流选择从 1 到 10 的任意整数,累计
整数和,先使得累计整数和达到 100 的玩家,即为胜者。
    如果我们将游戏规则改为 “玩家不能重复使用整数” 呢?
    例如,两个玩家可以轮流从公共整数池中抽取从 1 到 15 的整数(不放回),直
到累计整数和 >= 100。
    给定一个整数 maxChoosableInteger (整数池中可选择的最大数)和另一个整数
 desiredTotal(累计和),判断先出手的玩家是否能稳赢(假设两位玩家游戏时都表
 现最佳)?
    你可以假设 maxChoosableInteger 不会大于 20, desiredTotal 不会大于 
300。

示例:
输入:
maxChoosableInteger = 10
desiredTotal = 11
输出:
false

解释:
    无论第一个玩家选择哪个整数,他都会失败。
    第一个玩家可以选择从 1 到 10 的整数。
    如果第一个玩家选择 1,那么第二个玩家只能选择从 2 到 10 的整数。
    第二个玩家可以通过选择整数 10(那么累积和为 11 >= desiredTotal),从而
取得胜利.
    同样地,第一个玩家选择任意其他整数,第二个玩家都会赢。

很显然,这又是一个极小化极大的问题。之前已经提到过,极小化极大往往会重复计算很多次,就比如这道题,先手拿走1后手拿走2,和先手拿走2后手拿走1,是完全等价的。因此,为了避免重复计算,我们需要把“1和2已经被拿走”这个状态以及它的答案(先手能否稳赢)记录下来。 但这就有一个问题,题目条件是整数池的大小 maxChoosableInteger 不大于20,也就是说整个动态规划空间最高会达到20维,这显然是不可接受的。因为这个,之前还犯了一个错误,就是我误以为只需要记录整数池内所有剩下数的和就可以了,如果是这样可行的话,那么动态规划空间就是一维的,但后来发现这是不可行的,因为整数池内还剩下1和2,和还剩下3的状态显然是不能等价的,但是它们的和都是3,因此不能只记录整数池内剩下整数的和。

既然动态空间的维度过高,现在就要想办法对状态进行压缩了。 对于一个数字来说,它只有两种状态:在整数池内,或不在。因此只需要一个比特,而非一个int型,就可以表示一个数的所有状态。而整数池最多有20个数,int型是32位,因此只需要一个int型,就可以表示所有数的所有状态。

对状态进行压缩以后,就可以写代码了。值得注意的是,当整数池内的所有数之和比目标数还要小的时候,两个玩家都无法获胜,这种情况也属于先手无法获胜,因此也要返回false。 这道题实现的代码如下:

class Solution 
{
public:
    bool canIWin(int maxChoosableInteger, int desiredTotal) 
    {
        int state = 0;
        map<int, int> hash;
        return minMax(maxChoosableInteger, desiredTotal, state, hash);
    }
    bool minMax(int maxChoosableInteger, int desiredTotal, int state, 
        map<int, int>& hash)
    {
        if (hash[state] == 1) { return true; }
        if (hash[state] == -1) { return false; }
        if (stateToSum(state, maxChoosableInteger) < desiredTotal) 
        { 
        	return false; 
        }

        int new_state;
        for (int i = 0; i < maxChoosableInteger; ++i)
        {
            if (!(state & (1 << i))) 
            {
                if (i + 1 >= desiredTotal) 
                { 
                	return hash[state] = true; 
                }
                new_state = state + (1 << i);
                hash[new_state] = minMax(maxChoosableInteger, 
                    desiredTotal - (i + 1), new_state, hash);
                if (!hash[new_state]) 
                { 
                	return hash[state] = true;
                }
            }
        }
        return hash[state] = false;
    }
    int stateToSum(int state, int maxChoosableInteger)
    {
        int ans = 0;
        for (int i = 0; i < maxChoosableInteger; ++i)
        {
            if (!(state & (1 << i))) 
            { 
            	ans += i + 1; 
            }
        }
        return ans;
    }
};

2 预测赢家

Leetcode 486:

    给定一个表示分数的非负整数数组。 玩家1从数组任意一端拿取一个分数,随后玩
家2继续从剩余数组任意一端拿取分数,然后玩家1拿,……。每次一个玩家只能拿取一个
分数,分数被拿取之后不再可取。直到没有剩余分数可取时游戏结束。最终获得分数总
和最多的玩家获胜。
    给定一个表示分数的数组,预测玩家1是否会成为赢家。你可以假设每个玩家的玩法
都会使他的分数最大化。

示例 1:
输入: [1, 5, 2]
输出: False
解释: 一开始,玩家1可以从1和2中进行选择。
如果他选择2(或者1),那么玩家2可以从1(或者2)和5中进行选择。如果玩家2选择
了5,那么玩家1则只剩下1(或者2)可选。
所以,玩家1的最终分数为 1 + 2 = 3,而玩家2为 5。
因此,玩家1永远不会成为赢家,返回 False。

示例 2:
输入: [1, 5, 233, 7]
输出: True
解释: 玩家1一开始选择1。然后玩家2必须从5和7中进行选择。无论玩家2选择了哪个,
玩家1都可以选择233。
最终,玩家1(234分)比玩家2(12分)获得更多的分数,所以返回 True,表示玩家1
可以成为赢家。

注意:
1 <= 给定的数组长度 <= 20.
数组里所有分数都为非负数且不会大于10000000。
如果最终两个玩家的分数相等,那么玩家1仍为赢家。

其实如果做过另一道题 leetcode 877:石子游戏 的话,就可以看出这个题是那道题的更一般情况,因此这里不再赘述,请参阅另一篇博客https://blog.csdn.net/weixin_43590611/article/details/104009097

实现代码如下:

class Solution 
{
public:
    bool PredictTheWinner(vector<int>& nums) 
    {
        int n = nums.size();
        vector<int> dp(nums);
        for (int len = 1; len < n; ++len)
        {
            for (int i = 0; i + len < n; ++i)
            {
                dp[i] = max(nums[i] + sum(i + 1, i + len, nums) - dp[i + 1],
                    nums[i + len] + sum(i, i + len - 1, nums) - dp[i]);
            }
        }
        return dp[0] * 2 >= accumulate(nums.begin(), nums.end(), 0);
    }
    int sum(int i, int j, vector<int>& nums)
    {
        return accumulate(nums.begin() + i, nums.begin() + j + 1, 0);
    }
};

3 猜数字大小2

Leetcode 375:

    我们正在玩一个猜数游戏,游戏规则如下:
    我从 1 到 n 之间选择一个数字,你来猜我选了哪个数字。
    每次你猜错了,我都会告诉你,我选的数字比你的大了或者小了。
    然而,当你猜了数字 x 并且猜错了的时候,你需要支付金额为 x 的现金。直到你
猜到我选的数字,你才算赢得了这个游戏。

示例:
n = 10, 我选择了8.
第一轮: 你猜我选择的数字是5,我会告诉你,我的数字更大一些,然后你需要支付5块。
第二轮: 你猜是7,我告诉你,我的数字更大一些,你支付7块。
第三轮: 你猜是9,我告诉你,我的数字更小一些,你支付9块。
游戏结束。8 就是我选的数字。
你最终要支付 5 + 7 + 9 = 21 块钱。

给定 n ≥ 1,计算你至少需要拥有多少现金才能确保你能赢得这个游戏。

这个题和典型的二分查找有点类似,不过不同之处在于这次我们要使得花的钱最少,而非查找次数最少。因此我们不能简单地每次都猜某个范围的中位数。至于具体猜哪个,最后花的钱最少,这是无法事先计算的,只能把这个范围内猜数的所有情况的花费都算出来,再进行比较,取最小值,才能得到最佳策略。值得注意的是,猜一个数,有可能出现目标与它相等,目标比它大,目标比它小三种情况,而猜某个数的的花费,应该是猜这个数之后可能出现的三种情况中,花费最大的那个。 实现的代码如下:

class Solution 
{
public:
    int getMoneyAmount(int n) 
    {   
        vector<vector<int> > dp(n + 1, vector<int> (n + 1, -1));
        dynamicPro(1, n, dp);
        return dp[1][n];
    }
    int dynamicPro(int left, int right, vector<vector<int> >& dp)
    {
        if (left > right) { return 0; }
        if (dp[left][right] != -1) { return dp[left][right]; }
        if (left == right) { return dp[left][right] = 0; }
        int res = INT_MAX;
        for (int i = left; i <= right; ++i)
        {
            res = min(res, 
                i + max(dynamicPro(left, i - 1, dp), 
                    dynamicPro(i + 1, right, dp)));
        }
        return dp[left][right] = res;
    }
};

更多精彩内容,敬请期待。

发布了20 篇原创文章 · 获赞 4 · 访问量 1094

猜你喜欢

转载自blog.csdn.net/weixin_43590611/article/details/104114040