KMP算法（Java）

简介

KMP算法是一种字符串匹配算法，相对于BF算法，KMP算法的效率更高，当BF算法中失配时，主串与模式串都会回溯，效率较低。KMP算法匹配失配时，只需要将模式串回溯到适当的位置。

next数组

当失配时，模式串会回溯到一定的位置，回溯的位置取决于next数组。

next数组的代码

public static int[] getNext(String p){
        int[] next=new int[p.length()];
        int j=0,k=-1;//j为p中字符的下标，k为next数组的值
        next[0]=-1;//下标为0是为-1

        while( j < p.length() - 1){
            if (k==-1 || p.charAt(j)==p.charAt(k)){
                j++;
                k++;
                next[j] = k;
            }else{
                k = next[k];//
            }
        }
        return next;
    }

举一个例子

举一个例子
当j=0时，此时的next[0]=-1,当j=3时，此时的p[0]p[1]=p[1]p[2],所以当在j=3失配时，j回溯到j=2的位置。以此类推，当下标为j时，若是存在p[j]…p[j-k-1]=p[k]…p[0],则回溯到k+1的位置，否则的话，回溯到j=0的位置。在j=4时，不存在p[j]…p[j-k-1]=p[k]…p[0]，所以回溯到下标为0的位置，当j=5时，存在p[0]=p[4],所以回溯到下标0+1的位置…

KMP算法

public static int KMPmethod(String mainStr,String pattern){
        int i=0,j=0;//i为mainstr的下标
        int[] next=getNext(pattern);
        while (i<mainStr.length() && j<pattern.length()){
            if (j==-1 || mainStr.charAt(i)==pattern.charAt(j)){
                i++;
                j++;
            }else {
                j=next[j];
            }
            if (j == pattern.length()){
                return i-j;
            }
        }
        return -1;
    }

Chongch_M

发布了3 篇原创文章 · 获赞 3 · 访问量 75

私信关注

简介

next数组

KMP算法

猜你喜欢