文章目录
JZ52正则表达式匹配
题目描述
请实现一个函数用来匹配包括'.'和'*'
的正则表达式。模式中的字符'.'
表示任意一个字符,而'*'
表示它前面的字符
可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"
匹配,但是与"aa.a"和"ab*a"
均不匹配
示例1
输入
"aaa","a*a"
返回值
true
注:
1、'*'
表示它前面的字符
可以出现任意次(包含0次):
说明'*'
前面要有字符,即模式的第一个字符不可能是'*'
,最小是第二位可能是'*'
。
2、什么是正则表达式 参考这
模式识别
“匹配”容易想到一个一个的对比,进一步:
——先匹配判断原字符串第一个字符(原问题)
,然后将剩下的子字符串当做新的字符串来处理(子问题)
,接着判断子字符串的第一个字符,即递归方法
,递归属于自上向下,即从原问题到子问题
——或,原字符串s[:i]与模式p[:j]是否匹配取决于s[:i-1]与p[:j-1]的匹配状态,即,动态规划
,动态规划属于自下向上,代码实现中会创建一个一维或二维数组从小的状态开始记录。
方法一:递归
模板:
原问题
子问题
最后结果
题解:
假设主串为s,长度为sn, 模式串为p,长度为pn,
原问题:
s[0:sn-1]与p[0:pn-1]是否匹配
首先要明确:'*'
最小在模式串的第二位。对于模式串p,当前第i位
如果是第一位可能有’正常字符’、’.‘两种情况,如果是第二位及以上位,有’正常字符’、’*’、’.'三种情况。
如果第二位不是'*'
,那么第一位是否匹配只需看s和p的第一位是否相等或p的第一位是不是’.’;
如果第二位是'*'
, 由于'*'
可使其前面的字符出现0次,所以即使第一位不匹配,也不能确定整个字符串到时是否匹配。
所以我们针对模式串中的第二个字符是不是'*'
的情况进行讨论,得出子问题:
子问题:
当模式串中的第二个字符不是'*'
时,
1、如果p[i]为正常字符, 那么我们看s[i]是否等于p[i], 如果相等,说明第i位匹配成功,接下来看s[i+1...sn-1] 和 p[i+1...pn-1]
2、如果p[i] 为’.’, 它能匹配任意字符,直接看s[i+1...sn-1] 和 p[i+1...pn-1]
当模式串中的第二个字符是’*'时,
3.1、当s的第一个字符和p的第一个字符不匹配
时,由于p的第二个字符是'*'
,它可以使第一个字符出现0次,所以不能直接判定s与p是否匹配,需继续匹配判断。因s的第一位没匹配上,所以s保持不变,p向后移2位,即下一次匹配的子串是s[i...sn-1] 和p[i+2...pn-1]
;
3.2、当s的第一个字符和p的第一个字符匹配
时,s和p的第一个字符既然匹配了,s和p就应向后移动一位,匹配下一位。现在的问题是:s向后移动一位没问题,但由于'*'
的前一个字符可以出现任意次,出现一次和出现多次(因第一位已匹配,所以不可能出现0次)p的下一位是不确定的,分别如下:
3.2.1、出现一次:p的下一位需在模式串上向后移动两个字符
,即下一次匹配的子串是s[i+1...sn-1] 和p[i+2...pn-1]
;
3.2.2出现两次及以上: 首先出现多次是指该位置上的字符模式上(形式上)出现多次,而不是真的在字符串中复制多次,不会使后面的字符在字符串中的位置改变。当出现两次及以上时,p的下一位依然是该字符,所以模式保持不变
,即下一次匹配的子串是s[i+1...sn-1] 和p[i...pn-1]
;
三种情况如下图
则递归三部曲为:
1、递归函数功能(原问题)
:match(s, p) -> bool, 表示p是否可以匹配s
2、递归终止条件
:
如果s 和 p 同时为空,表明正确匹配
如果s不为空,p为空,表明,不能正确匹配
如果s为空,p不为空,需要计算,不能直接给出结果
3、下一步递归(子问题)
:
对于前面讨论的情况1,2进行合并,如果*s == *p || *p == ‘.’,则match(s+1, p+1)
对于情况3,如果重复一次或者多次,则match(s+1,p)||match(s+1,p+2),如果重复0次,则match(s, p+2)
代码:
class Solution {
public:
bool match(char* s, char* p)
{
// 如果 s 和 p 同时为空
if (*s == '\0' && *p == '\0') return true;
// 如果 s不为空, 但是 p 为空
if (*s != '\0' &&*p == '\0') return false;
// 如果没有 '*'
if (*(p+1) != '*') {
//如果模式子串的第二个字符不等于'*'
if (*s != '\0' && (*s == *p || *p == '.'))
return match(s+1, p+1);
else
return false;
}
// 如果有 '*'
else {
//如果模式子串的第二个字符等于'*'
bool ret = false;
// 重复 1 次或多次
if (*s != '\0' && (*s == *p || *p == '.'))//如果s和p的子串的第一个字符匹配
ret = match(s+1, p)||match(s+1,p+2);
// 重复 0 次,
//如果s和p的子串的第一个字符不匹配
return ret || match(s, p+2);
}
}
};