地址:https://leetcode-cn.com/problems/best-time-to-buy-and-sell-stock-iv
第 1 步:状态定义
dp[i][j][K]
:表示到第 i
天为止,已经交易了 j
次,并且当前持股状态为 K
的最大收益
说明:
- 到第
i
天为止(从0
开始计算,到len - 1
),考虑的区间是[0, i]
,这里len
为数组prices
的长度; - 已经交易了
j
次,j
从0
开始计算,到k - 1
为止; - 持股状态
K
(大写)只有 2 个值:0
和1
。0
表示不持股,1
表示持股,为了与k
区分,因此使用K
(大写)。
第 2 步:状态转移方程
下面考虑 dp[i][j][0]
和 dp[i][j][1]
可以怎样转移过来。
动态规划用于解决多阶段的决策问题,这里的阶段就是每一天,因此,状态都是从前一天的某一个之前的状态转移过来。
dp[i][j][0]
:表示这一天发生了第j
次交易,并且不持股。
特别说明一下:发生交易的标志是在某一天,发生一次购买股票的行为,即发生一次交易。
分类讨论的依据是:昨天是否持股。
(1)昨天不持股,今天还不持股,说明没有发生新的交易;
(2)昨天持股,今天不持股,说明这次交易结束了。这两种情况都在一次交易里。
二者取最大值,即:
dp[i][j][0] = max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i])
注意:中间的那个表示交易次数的状态都是 j
。
dp[i][j][1]
:表示这一天已经交易了j
次,并且持股。
分类讨论的依据依然是:昨天是否持股。
(1)昨天持股,今天还持股,说明没有发生新的交易,这两天在同一个交易区间里;
(2)昨天不持股,今天持股,说明开启了一次新的交易。
二者取最大值,即:
dp[i][j][1] = max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i])
第 3 步: 初始化
- 所有持股的状态值都设置为一个很大的负数(至少应该是最大的股价的负数 - 1),表示未知,不持股的时候,状态值为 0;
- 这里
i
和j
下标都有-1
,所以i
和j
可以多设置一行,以避免复杂的分类讨论。以下只展示不多设置一行的代码。多设置一行的代码留给读者完成。
第 4 步:输出
最后一个阶段的最后一个状态,且是不持股的那个状态,即 dp[len - 1][k - 1][0]
(i
和 j
不多设置一行的时候)。
第 5 步:考虑状态压缩
注意到两个状态转移方程,当前行只依赖上一行,并且 j
只依赖 j - 1
,但是是另一张表的状态值,因此直接砍掉第一维即可。
先写出没有考虑状态压缩的版本。
Java 代码:
public class Solution {
public int maxProfit(int k, int[] prices) {
int len = prices.length;
// 特判
if (k == 0 || len < 2) {
return 0;
}
if (k >= len / 2) {
return greedy(prices, len);
}
// dp[i][j][K]:到下标为 i 的天数为止(从 0 开始),到下标为 j 的交易次数(从 0 开始)
// 状态为 K 的最大利润,K = 0 表示不持股,K = 1 表示持股
int[][][] dp = new int[len][k][2];
// 初始化:把持股的部分都设置为一个较大的负值
for (int i = 0; i < len; i++) {
for (int j = 0; j < k; j++) {
dp[i][j][1] = -9999;
}
}
// 编写正确代码的方法:对两个"基本状态转移方程"当 i - 1 和 j - 1 分别越界的时候,做特殊判断,赋值为 0 即可
for (int i = 0; i < len; i++) {
for (int j = 0; j < k; j++) {
if (i == 0) {
dp[i][j][1] = -prices[0];
dp[i][j][0] = 0;
} else {
if (j == 0) {
dp[i][j][1] = Math.max(dp[i - 1][j][1], -prices[i]);
} else {
// 基本状态转移方程 1
dp[i][j][1] = Math.max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i]);
}
// 基本状态转移方程 2
dp[i][j][0] = Math.max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i]);
}
}
}
// 说明:i、j 状态都是前缀性质的,只需返回最后一个状态
return dp[len - 1][k - 1][0];
}
private int greedy(int[] prices, int len) {
// 转换为股票系列的第 2 题,使用贪心算法完成,思路是只要有利润,就交易
int res = 0;
for (int i = 1; i < len; i++) {
if (prices[i - 1] < prices[i]) {
res += prices[i] - prices[i - 1];
}
}
return res;
}
}
说明:状态数组 i
和 j
的部分可以分别多设置一行,这样在代码中可以少掉一些判断,请读者实现一下,进行对比。
再写出状态压缩的版本。
Java 代码:
public class Solution {
public int maxProfit(int k, int[] prices) {
int len = prices.length;
if (k == 0 || len < 2) {
return 0;
}
if (k >= len / 2) {
return greedy(prices, len);
}
int[][] dp = new int[k][2];
for (int j = 0; j < k; j++) {
dp[j][1] = -9999;
}
for (int price : prices) {
for (int j = 0; j < k ; j++) {
if (j == 0) {
dp[j][1] = Math.max(dp[j][1], -price);
} else {
// 基本状态转移方程 1
dp[j][1] = Math.max(dp[j][1], dp[j - 1][0] - price);
}
// 基本状态转移方程 2
dp[j][0] = Math.max(dp[j][0], dp[j][1] + price);
}
}
return dp[k - 1][0];
}
private int greedy(int[] prices, int len) {
int res = 0;
for (int i = 1; i < len; i++) {
if (prices[i - 1] < prices[i]) {
res += prices[i] - prices[i - 1];
}
}
return res;
}
}
说明:状态转移方程可以设置 k + 1
行,第一行全为 0
,感兴趣的读者可以尝试一下。
下面是状态数组语义化的版本,与上面的代码没有本质差别,供读者比对。
Java 代码:
import java.util.Arrays;
public class Solution12 {
public int maxProfit(int k, int[] prices) {
int len = prices.length;
if (len < 2 || k == 0) {
return 0;
}
if (k >= len / 2) {
return greedy(prices, len);
}
// k 次持股分别的状态
int[] stock = new int[k];
Arrays.fill(stock, -9999);
// k 次不持股(持有现金)分别的状态
int[] cash = new int[k];
for (int price : prices) {
for (int i = 0; i < k; i++) {
stock[i] = Math.max(stock[i], (i > 0 ? cash[i - 1] : 0) - price);
cash[i] = Math.max(cash[i], stock[i] + price);
}
}
return cash[k - 1];
}
private int greedy(int[] prices, int len) {
int maxProfit = 0;
for (int i = 1; i < len; i++) {
if (prices[i] > prices[i - 1]) {
maxProfit += prices[i] - prices[i - 1];
}
}
return maxProfit;
}
}