Longest Common Substring
- Brute Force
遍历a
和b
所有位置的组合,向后延伸,直到遇到两个不同的字符,复杂度是\(n^3\)级别。
class Solution {
public:
// 返回所有结果
vector<string> longestCommonSubstring(string& a, string& b) {
vector<string> ans;
int maxLen = 0;
for (int i = 0; i < a.size(); ++i) {
for (int j = 0; j < b.size(); ++j) {
string cur;
for (int m = i, n = j; m < a.size() && n < b.size(); ++m, ++n) {
if (a[m] != b[n]) {
break;
}
cur += a[m];
}
if (cur.size() && cur.size() >= maxLen) {
maxLen = cur.size();
ans.push_back(cur);
}
}
}
return ans;
}
};
- DP
暴力解有很多重复计算:比如以\(i\)和\(j\)为起点去向后延伸,我们可能需要比较\(i+1\)和\(j+1\)、\(i+2\)和\(j+2\)...而以\(i+1\)和\(j+1\)为起点时,仍然要比较\(i+2\)和\(j+2\),重叠子问题给动态规划带来了可能。
暴力做法是将每个\(i\)和\(j\)作为起点,现在我们考虑将\(i\)和\(j\)作为终点,令\(L(i,j)\)表示以\(i\)和\(j\)作为结尾的相同子串的最大长度,很快就可以推出:
\[L(i,j)= \begin{cases} 1+L(i-1,j-1)& \text{a[i]=b[j]}\\ 0& \text{a[i]!=b[j]} \end{cases}\]
为了简便,假设下标从1开始,那么边界条件:\(L(0,j)=0,L(i,0)=0\)。
class Solution {
public:
int longestCommonSubstring(string& a, string& b) {
vector<vector<int>> L(1 + a.size(), vector<int>(1 + b.size(), 0));
int maxLen = 0;
for (int i = 1; i <= a.size(); ++i) {
for (int j = 1; j <= b.size(); ++j) {
if (a[i - 1] == b[j - 1]) {
L[i][j] = 1 + L[i - 1][j - 1];
}
else {
L[i][j] = 0;
}
maxLen = max(maxLen, L[i][j]);
}
}
return maxLen;
}
};
显然时间降为\(O(n^2)\),空间升为\(O(n^2)\)。仔细观察,计算\(L(i,j)\)只需要左上方\(L(i-1,j-1)\)的信息,所以我们按照斜线方向计算,可以将空间优化到\(O(1)\):
class Solution {
public:
int longestCommonSubstring(string& a, string& b) {
// from the up-right corner
int row = 0, col = b.size() - 1;
int maxLen = 0;
while (row < a.size()) {
int curLen = 0;
for (int i = row, j = col; i < a.size() && j < b.size(); ++i, ++j) {
if (a[i] == b[j]) {
++curLen;
}
else {
curLen = 0;
}
maxLen = max(maxLen, curLen);
}
if (col > 0) {
--col; // 斜线左移
}
else {
++row; // 斜线下移
}
}
return maxLen;
}
};
(TODO)输出所有的最长公共子串
Longest Common Subsequence
- Brute Force
找到a
的所有子序列,判断是否是b
的子序列,指数级复杂度,也就没有写出来的必要了。 - DP
重叠子问题很明显,而且LCS具有最优子结构,令\(L(i,j)\)表示以\(i\)和\(j\)作为结尾的LCS长度:
\[L(i,j)= \begin{cases} 1+L(i-1,j-1)& \text{a[i]=b[j]}\\ max\{L(i-1,j),L(i,j-1)\}& \text{a[i]!=b[j]} \end{cases}\]
为了简便,假设下标从1开始,那么边界条件:\(L(0,j)=0,L(i,0)=0\)。
class Solution {
public:
int longestCommonSubsequence(string text1, string text2) {
const int m = text1.size(), n = text2.size();
vector<vector<int>> L(m + 1, vector<int>(n + 1, 0));
int ans = 0;
for(int i = 1;i <= m;++i) {
for(int j = 1;j <= n;++j) {
if(text1[i - 1] == text2[j - 1]) {
L[i][j] = 1 + L[i - 1][j - 1];
}
else {
L[i][j] = max(L[i - 1][j], L[i][j - 1]);
}
ans = max(ans, L[i][j]);
}
}
return ans;
}
};
时间和空间都是\(O(mn)\)。类似的,\(L(i,j)\)依赖于左上角\(L(i-1,j-1)\)、左边\(L(i,j-1)\)、上边\(L(i-1,j)\),可以只存储上一行和当前行的\(L\)。进一步考虑:可以只存储当前行的\(L\),外加一个变量\(pre\)存储左上角\(L(i-1,j-1)\),空间可以优化到\(O(min(m,n))\):
class Solution {
public:
int longestCommonSubsequence(string text1, string text2) {
const int m = text1.size(), n = text2.size();
if(m < n) {
return longestCommonSubsequence(text2, text1);
}
vector<int> curRow(n + 1, 0);
int pre = 0, ans = 0;
for(int i = 1;i <= m;++i) {
pre = curRow[0];
for(int j = 1;j <= n;++j) {
int tmp = curRow[j];
if(text1[i - 1] == text2[j - 1]) {
curRow[j] = 1 + pre;
}
else {
curRow[j] = max(curRow[j], curRow[j - 1]);
}
ans = max(ans, curRow[j]);
pre = tmp;
}
}
return ans;
}
};
(TODO)输出所有的最长公共子串
Longest Increasing Subsequence
- DP
\(dp[i]\)表示只考虑\(i\)及之前的信息,所形成的LIS的长度:
\[dp[i]= \begin{cases} 1+max\{dp[j]\}, 0 \leq j<i& \text{a[i]>a[j]}\\ max\{dp[j])\}, 0 \leq j<i& \text{a[i]$\leq$a[j]} \end{cases}\]
最终答案即是\(dp\)数组的最大值:
class Solution {
public:
int lengthOfLIS(vector<int>& nums) {
if(!nums.size()) {
return 0;
}
vector<int> dp(nums.size(), 1);
int ans = 1;
for(int i = 1;i < nums.size();++i) {
int curMax = 0;
for(int j = 0;j < i;++j) {
if(nums[i] > nums[j]) {
curMax = max(curMax, dp[j]);
}
}
dp[i] = 1 + curMax;
ans = max(ans, dp[i]);
}
return ans;
}
};
时间\(O(n^2)\),空间\(O(n)\)。
- DP+Binary Search
遍历数组的过程中,不停填充\(dp\)数组,维护\(dp\)数组使得其存储递增序列:
如果\(nums[i]<dp[0]\),更新\(dp[0]\);
如果\(nums[i]>dp[len]\),\(++len\),并且存入\(nums[i]\);
如果\(nums[i]\)介于\(dp\)中间,就二分查找\(nums[i]\)的位置,并更新相应的\(dp\)值。
举例来说,\(nums=[0,8,4,12,2]\),\(dp\)数组:
\([0]\)
\([0,8]\)
\([0,4]\)
\([0,4,12]\)
\([0,2,12]\)
虽然\(dp\)数组最终存储的不是LIS,但长度确是LIS的长度:
class Solution {
public:
int lengthOfLIS(vector<int>& nums) {
const int n = nums.size();
if(0 == n)
return 0;
vector<int> dp(n);
dp[0] = nums[0];
int len = 0;
for(int i = 1;i < n;++i) {
if(nums[i] < dp[0]) {
dp[0] = nums[i];
}
else if(nums[i] > dp[len]) {
dp[++len] = nums[i];
}
else {
int index = biSearch(dp, 0, len, nums[i]);
dp[index] = nums[i];
}
}
return len + 1;
}
private:
int biSearch(vector<int>& nums, int l, int r, int target) {
while(l < r) {
int m = l + (r - l) / 2;
if(nums[m] == target) {
return m;
}
if(target > nums[m]) {
l = m + 1;
}
else {
r = m;
}
}
return l;
}
};
时间\(O(nlgn)\),空间\(O(n)\)。
Longest Palindromic Substring
- Brute Force
枚举每个子串的起始和结束位置,判断是否回文。时间\(O(n^3)\),空间\(O(1)\)。 - DP
假设输入ababa
,如果我们已经判断了bab
是回文的,那么ababa
就不需要再扫描一遍,因为两段都是a
。
所以一个很直观的动规:
令\(dp(i,j)\)去记忆\(i\)和\(j\)之间的串是否回文,那么转移方程:
\[dp(i,j)=dp(i+1,j-1)\&\&s[i]=s[j]\]
边界条件\(dp(i,i)=true,dp(i,i+1)=(s[i]=s[i+1])\):
// 填充方向:由边界条件dp(i,i)向其他地方扩展,只需要填充j>i的三角形部分
class Solution {
public:
string longestPalindrome(string s) {
const int len = s.length();
if (!len)
return "";
vector<vector<bool>> dp(len, vector<bool>(len, false));
int maxLen = 1;
int l = 0, r = 0;
for (int i = len - 1; i >= 0; --i)
for (int j = i; j < len; ++j) {
if (i == j) {
dp[i][j] = true;
continue;
}
else if(i + 1 == j) {
dp[i][j] = (s[i] == s[i + 1]);
if (dp[i][j] && 2 > maxLen) {
maxLen = 2;
l = i;
r = j;
}
continue;
}
if (s[i] == s[j]) {
dp[i][j] = dp[i + 1][j - 1];
if (dp[i][j] && j - i + 1 > maxLen) {
maxLen = j - i + 1;
l = i;
r = j;
}
}
else
dp[i][j] = false;
}
return s.substr(l, r - l + 1);
}
};
时间\(O(n^2)\),空间\(O(n^2)\)。
- Expand Around Center
回文串都是镜像对称的,可以遍历整个串,从当前位置向两边延伸,直到遇到不相等的字母。这里要考虑字符串长度的奇偶:
class Solution {
public:
string longestPalindrome(string s) {
const int n = s.length();
if (!n)
return "";
int start = 0, end = 0;
for (int i = 0; i < n; ++i) {
int len1 = expandCenter(s, i, i);
int len2 = expandCenter(s, i, i + 1);
int len = max(len1, len2);
if (len > end - start + 1) {
start = i - (len - 1) / 2;
end = i + len / 2;
}
}
return s.substr(start, end - start + 1);
}
private:
int expandCenter(string s, int start, int end) {
while (start >= 0 && end < s.length() && s[start] == s[end]) {
--start;
++end;
}
return end - start - 1;
}
};
时间\(O(n^2)\),空间\(O(1)\)。
- Manacher's Algorithm(待填)
时间\(O(n)\)。
Longest Palindromic Subsequence
- DP
令\(dp(i,j)\)表示介于\(i\)和\(j\)间的LPS的长度,那么状态转移方程:
\[dp(i,j)= \begin{cases} 2+dp(i+1,j-1)& \text{s[i]=s[j]}\\ max\{dp(i+1,j),dp(i,j-1)\}& \text{s[i]$\neq$s[j]} \end{cases}\]
class Solution {
public:
int longestPalindromeSubseq(string s) {
const int n = s.size();
if(!n) {
return 0;
}
vector<vector<int>> dp(n, vector<int>(n, 0));
int ans = 1;
for(int i = n - 1;i >= 0;--i) {
for(int j = i;j < n;++j) {
if(i == j) {
dp[i][j] = 1;
continue;
}
if(s[i] == s[j]) {
dp[i][j] = dp[i + 1][j - 1] + 2;
}
else {
dp[i][j] = max(dp[i + 1][j], dp[i][j - 1]);
}
ans = max(ans, dp[i][j]);
}
}
return ans;
}
};
时间\(O(n^2)\),空间\(O(n^2)\)。
同样,空间可以优化到\(O(n)\)。
class Solution {
public:
int longestPalindromeSubseq(string s) {
const int n = s.size();
if(!n) {
return 0;
}
vector<int> dp(n, 0);
int ans = 1, pre = 0;
for(int i = n - 1;i >= 0;--i) {
pre = dp[0];
for(int j = i;j < n;++j) {
int tmp = dp[j];
if(i == j) {
dp[j] = 1;
continue;
}
if(s[i] == s[j]) {
dp[j] = pre + 2;
}
else {
dp[j] = max(dp[j - 1], dp[j]);
}
pre = tmp;
ans = max(ans, dp[j]);
}
}
return ans;
}
};