简介
KMP算法是一种字符串匹配算法,相对于BF算法,KMP算法的效率更高,当BF算法中失配时,主串与模式串都会回溯,效率较低。KMP算法匹配失配时,只需要将模式串回溯到适当的位置。
next数组
当失配时,模式串会回溯到一定的位置,回溯的位置取决于next数组。
next数组的代码
public static int[] getNext(String p){
int[] next=new int[p.length()];
int j=0,k=-1;//j为p中字符的下标,k为next数组的值
next[0]=-1;//下标为0是为-1
while( j < p.length() - 1){
if (k==-1 || p.charAt(j)==p.charAt(k)){
j++;
k++;
next[j] = k;
}else{
k = next[k];//
}
}
return next;
}
举一个例子
当j=0时,此时的next[0]=-1,当j=3时,此时的p[0]p[1]=p[1]p[2],所以当在j=3失配时,j回溯到j=2的位置。以此类推,当下标为j时,若是存在p[j]…p[j-k-1]=p[k]…p[0],则回溯到k+1的位置,否则的话,回溯到j=0的位置。在j=4时,不存在p[j]…p[j-k-1]=p[k]…p[0],所以回溯到下标为0的位置,当j=5时,存在p[0]=p[4],所以回溯到下标0+1的位置…
KMP算法
public static int KMPmethod(String mainStr,String pattern){
int i=0,j=0;//i为mainstr的下标
int[] next=getNext(pattern);
while (i<mainStr.length() && j<pattern.length()){
if (j==-1 || mainStr.charAt(i)==pattern.charAt(j)){
i++;
j++;
}else {
j=next[j];
}
if (j == pattern.length()){
return i-j;
}
}
return -1;
}