PAT-ADVANCED1071——Speech Patterns

我的PAT-ADVANCED代码仓：https://github.com/617076674/PAT-ADVANCED

原题链接：https://pintia.cn/problem-sets/994805342720868352/problems/994805398257647616

题目描述：

题目翻译：

1071 讲话模式

人们通常在同一个词的同义词中有偏好。例如，有些人可能更喜欢“the police”，而有些人可能更喜欢“the cops”。分析这样的模式可以帮助确认说话者的身份，这在验证时很有用，例如，他是否仍然是网络头像背后的同一个人。

现在给出一段从某人的演讲中抽样的文本，你能找到这个人最常用的单词吗？

输入格式：

每个输入文件包含一个测试用例。对每个测试用例，有一行长度不超过1048576个字符的文本，以回车符\n结束。输入包含至少一个字母数字字符，即来自集合[0-9 A-Z a-z]的一个字符。

输出格式：

对每个测试用例，在一行中打印输入文本中最常出现的单词，后跟空格和输入中出现的次数。如果有多个这样的单词，则打印按字典顺序排列的最小单词。这个词应该全部小写。这里“单词”被定义为由非字母数字字符或行开头/结尾分隔的连续字母数字字符序列。

请注意，单词不区分大小写。

输入样例：

Can1: "Can a can can a can?  It can!"

输出样例：

can 5

知识点：字符串、计数

思路：用map集合统计每个单词出现的次数

时间复杂度是O(n)，其中n为输入字符串的字符数量。空间复杂度是O(m)，其中m为输入字符串中不同单词数量。

C++代码：

#include<iostream>
#include<string>
#include<map>

using namespace std;

bool isPartOfWord(char c);

int main(){
	string input;
	getline(cin, input);
	for(int i = 0; i < input.length(); i++){
		if(input[i] >= 'A' && input[i] <= 'Z'){
			input[i] = input[i] - 'A' + 'a';
		}
	}
	map<string, int> wordMap;
	for(int i = 0; i < input.length(); i++){
		if(!isPartOfWord(input[i])){
			continue;
		}
		int j = i;
		while(isPartOfWord(input[j])){
			j++;
		}
		wordMap[input.substr(i, j - i)]++;
		i = j;
	}
	string result;
	int count = 0;
	for(map<string, int>::iterator it = wordMap.begin(); it != wordMap.end(); it++){
		if(it->second > count){
			result = it->first;
			count = it->second;
		}
	}
	cout << result << " " << count << endl;
	return 0;
}

bool isPartOfWord(char c){
	if((c >= '0' && c <= '9') || (c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z')){
		return true;
	}
	return false;
}

C++解题报告：

PAT-ADVANCED1071——Speech Patterns

思路：用map集合统计每个单词出现的次数

猜你喜欢