题目链接:https://leetcode-cn.com/problems/regular-expression-matching/
题目描述
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。
'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
说明:
- s 可能为空,且只包含从 a-z 的小写字母。
- p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
思路
1 递归解决
这道题的难点在于对于模式中 * 字符的状态转换要考虑全:
例如对于’ . * ’ 这种特殊模式的处理(匹配所有情况)
当模式中第二个字符是 * 时,有几种情况:
如果当前字符串的字符和模式字符已经匹配:
(1)字符串向后移动1个字符,模式向后移动2个字符; 此时用* 去匹配字符串的该字符并结束 * 模式
(2)字符串向后移动1个字符,模式不变; 此时匹配字符串的当前1个字符
如果当前字符串的字符和模式字符不匹配:
字符串不变,模式向后移动2个字符; 模式不起作用(匹配0个)
两个版本的算法完全一样。区别在易读版本的 substr 会创建新字符串,产生大量的内存申请和复制的操作。优化后的版本规避了此问题。
- 递归版本
class Solution {
public:
bool isMatch(string s, string p) {
if(p.empty())
return s.empty();
// 当前字符匹配
bool first_match = !s.empty() && (p[0] == s[0] || p[0] == '.');
// 下一个模式字符是*
if(p.size() >= 2 && p[1] =='*'){
return isMatch(s, p.substr(2)) || (first_match && isMatch(s.substr(1), p));
} else{
return first_match && isMatch(s.substr(1), p.substr(1));
}
}
};
- 优化版本
// 优化后的版本 20ms
class Solution {
public:
bool isMatch(string s, string p) {
return isMatch(s.c_str(), p.c_str());
}
bool isMatch(const char* s, const char* p) {
if(*p == 0) return *s == 0;
auto first_match = *s && (*s == *p || *p == '.');
if(*(p+1) == '*'){
return isMatch(s, p+2) || (first_match && isMatch(++s, p));
}
else{
return first_match && isMatch(++s, ++p);
}
}
};
2 动态规划
class Solution {
public:
bool isMatch(string s, string p) {
int m = s.size(), n = p.size();
vector<vector<bool>> dp(m + 1, vector<bool>(n + 1, false));
dp[0][0] = true;
for (int i = 0; i <= m; i++) {
for (int j = 1; j <= n; j++) {
if (p[j - 1] == '*') {
dp[i][j] = dp[i][j - 2] || (i && dp[i - 1][j] && (s[i - 1] == p[j - 2] || p[j - 2] == '.')); // // *使用0个字符 || *使用字符
} else {
dp[i][j] = i && dp[i - 1][j - 1] && (s[i - 1] == p[j - 1] || p[j - 1] == '.');
}
}
}
return dp[m][n];
}
};