版权声明:我的GitHub:https://github.com/617076674。真诚求星! https://blog.csdn.net/qq_41231926/article/details/83903097
我的PAT-ADVANCED代码仓:https://github.com/617076674/PAT-ADVANCED
原题链接:https://pintia.cn/problem-sets/994805342720868352/problems/994805398257647616
题目描述:
题目翻译:
1071 讲话模式
人们通常在同一个词的同义词中有偏好。例如,有些人可能更喜欢“the police”,而有些人可能更喜欢“the cops”。分析这样的模式可以帮助确认说话者的身份,这在验证时很有用,例如,他是否仍然是网络头像背后的同一个人。
现在给出一段从某人的演讲中抽样的文本,你能找到这个人最常用的单词吗?
输入格式:
每个输入文件包含一个测试用例。对每个测试用例,有一行长度不超过1048576个字符的文本,以回车符\n结束。输入包含至少一个字母数字字符,即来自集合[0-9 A-Z a-z]的一个字符。
输出格式:
对每个测试用例,在一行中打印输入文本中最常出现的单词,后跟空格和输入中出现的次数。 如果有多个这样的单词,则打印按字典顺序排列的最小单词。 这个词应该全部小写。 这里“单词”被定义为由非字母数字字符或行开头/结尾分隔的连续字母数字字符序列。
请注意,单词不区分大小写。
输入样例:
Can1: "Can a can can a can? It can!"
输出样例:
can 5
知识点:字符串、计数
思路:用map集合统计每个单词出现的次数
时间复杂度是O(n),其中n为输入字符串的字符数量。空间复杂度是O(m),其中m为输入字符串中不同单词数量。
C++代码:
#include<iostream>
#include<string>
#include<map>
using namespace std;
bool isPartOfWord(char c);
int main(){
string input;
getline(cin, input);
for(int i = 0; i < input.length(); i++){
if(input[i] >= 'A' && input[i] <= 'Z'){
input[i] = input[i] - 'A' + 'a';
}
}
map<string, int> wordMap;
for(int i = 0; i < input.length(); i++){
if(!isPartOfWord(input[i])){
continue;
}
int j = i;
while(isPartOfWord(input[j])){
j++;
}
wordMap[input.substr(i, j - i)]++;
i = j;
}
string result;
int count = 0;
for(map<string, int>::iterator it = wordMap.begin(); it != wordMap.end(); it++){
if(it->second > count){
result = it->first;
count = it->second;
}
}
cout << result << " " << count << endl;
return 0;
}
bool isPartOfWord(char c){
if((c >= '0' && c <= '9') || (c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z')){
return true;
}
return false;
}
C++解题报告: