给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。
本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:
- 数据0:小规模字符串,测试基本正确性;
- 数据1:随机数据,String 长度为 105,Pattern 长度为 10;
- 数据2:随机数据,String 长度为 105,Pattern 长度为 102;
- 数据3:随机数据,String 长度为 105,Pattern 长度为 103;
- 数据4:随机数据,String 长度为 105,Pattern 长度为 104;
- 数据5:String 长度为 106,Pattern 长度为 105;测试尾字符不匹配的情形;
- 数据6:String 长度为 106,Pattern 长度为 105;测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 106 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 105 的字符串。每个字符串都非空,以回车结束。
输出格式:
对每个 Pattern,按照题面要求输出匹配结果。
输入样例:
abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz
输出样例:
abcabcacabxy
Not Found
Not Found
#include "bits/stdc++.h"
using namespace std;
int search_next[100000];
void to_next(string pattern){
int match = -1;
int i = 0;
int n = pattern.size();
search_next[0] = -1;
while(i < n){
if(match == -1 || pattern[match] == pattern[i]){
search_next[++i] = ++match;
}
else match = search_next[match];
}
}
int to_find(string text, string pattern){
to_next(pattern);
int n = text.size();
int i = 0, match = 0, ans = 0;
while(i < n){
if(match == -1 || text[i] == pattern[match])
i++, match++;
else match = search_next[match];
if(match == pattern.size()) return i - pattern.size();
}
return -1;
}
int main(int argc, char const *argv[])
{
string text;
string pattern;
cin>>text;
int n;
cin>>n;
while(n--){
cin>>pattern;
int flag = to_find(text, pattern);
if (flag == -1)
cout<<"Not Found"<<endl;
else{
for(int i = flag; i < text.size(); i++)
printf("%c", text[i]);
printf("\n");
}
}
return 0;
}