leetcode 214 Shortest Palindrome kmp算法 前缀后缀字符串匹配

0 leetcode 214. Shortest Palindrome  本题的描述是一个串前方加上一些字符串,使其成为一个回文串。

形式类似于(添加部分)(回文部分)(其余部分),所以我们的目标就是将其回文部分求出来,或者把他的长度求出来。

如果用暴力解法,那么问题就变成O(N*N)的复杂度,我们希望优雅地解决,所以我们用到kmp算法求nxt数组。

kmp算法是求字符串匹配的算法,下面记录个人学习笔记。

1 串的匹配问题:用串p去匹配串s,意为比较串s中是否存在串p;普通的方法时间复杂度为o(n*m),因为每次都需要重新对串p进行比较;kmp算法的作用就是用一个数组记录模式串p的信息,用于加快上述匹配任务,同时也有一些变形。

2 next数组:上面说到用一个数组来记录模式串p的信息,这个数组就是next数组,它记录了当前位置上,前缀子串与后缀子串相等的最大的长度。那么在求出next数组之后,模式串在移动的时候,就不用在一个个地从头开始移动了,而可以一次移动最大前缀长度的距离。

3 next数组的求法,这里用一张图来表示

在我们从1开始求nxt数组的时候,一直求到nxt[j],此时我们需要利用到nxt[j-1]的信息,令k = nxt[j-1],k的意思为:在模式串p[0,j-1](下标从0到下标j-2,共j-1个字符),前缀后缀数目相同的字符串的最大长度为k,如图中的两段阴影部分是相等的。那么此时我们比较前缀串的下一个字符p[k],与后缀串的下一个字符p[j-1]是否相同。如果两者相同,那么nxt[j] = nxt[j-1] + 1,相当于延长一个前缀串长度。如果两者不同,那么我们要重新找前缀树和后缀树相同的长度。(两者相同的正确性证明:因为在nxt为j-1时性质成立,而且在nxt为j时,已经进行了自增,所以nxt一定为最大的前缀串和后缀串的长度)

下面来解释,如果前缀串的下一个字符p[k],与后缀串的下一个字符p[j-1]不同时,如何处理。第一点,我们需要找的是前缀串,与后缀串的最大长度,且后缀串的最后一个字符是p[j-1],所以我们每次找的时候,都是从p[k]附近找一个位置,然后和p[j-1]进行比较。第二点,前缀串此时为p[0,k],但是我们没有达到让他增长,所以前缀串必须进行缩短,所以从p[k]附近找缩小为从p[k]向前找。下面我们再用一张图来表示

刚才我们说到,nxt[j-1]为k时,两个阴影部分的字符串是相等的,那么我们同样可以再nex[k]处得到这个结论:前面两个深色阴影区域的字符串是相等的,且长度都是nxt[k];并且由于对称性,后面两个深色阴影也是相等的。然后我们退一步看,如何尽可能地找到前缀串和后缀串最长的的值呢?结论:这个串就是深色的第一个串+1.证明:因为我们有了结论--浅色串后面的一个字符不相同,所以我们把前缀串给截短了,截短的最长的长度就是深色串(这个性质是nxt数组维护的)。所以我们可以从深色串开始着手求下一个最长的前缀数组与后缀数组相同的串。4 好的,到目前为止,我们对nxt的数组分析结束,代码的话文末会提供实现。

4 好的,我们现在回到问题,怎样求(添加部分)(回文部分)(其余部分)中回文部分的长度呢,我们可以把问题变种,为求最长前缀后缀匹配问题,所以要对字符串做出一些变换。首先将字符串翻转,然后变为一个新字符串,rev = reverse(s), l = s + “#” + rev

所以 l = (回文部分)(其余部分)#(其余部分)(回文部分),因为回文串的对称性,我们再对字符串I求nxt数组即可,但是注意nxt数组的下标为记录当前字符的之前的字符的最大长度,所以如果要直接利用kmp算法的nxt数组的话,还需要将字符串l再延长一个长度,然后把nxt[l.size()-1]输出为回文串长度即可。

5 求nxt数组的代码

vector<int> getnext(string p)//the next
{
    int n = p.size();
    vector<int> next(n, 0);
    next[0] = -1;
    for (int j = 1; j < n; ++j)
    {
        int k = next[j - 1];
        while (k != -1 && p[k] != p[j - 1])
            k = next[k];
        next[j] = k + 1;
    }
    return next;
}

6 referenct 

https://blog.csdn.net/v_july_v/article/details/7041827

猜你喜欢

转载自blog.csdn.net/mistakk/article/details/83114497