题目:
新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。
本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。
输入格式:
输入说明:输入首先给出一个正整数N(≤1e5),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#中的内容均被认为是一个话题,输入保证#成对出现。
输出格式:
第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more …,其中k是另外几条热门话题的条数。输入保证至少存在一条话题。
注意:两条话题被认为是相同的,如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后,它们是相同的字符串;同时它们有完全相同的分词。输出时除首字母大写外,只保留小写英文字母和数字,并用一个空格分隔原文中的单词。
输入样例:
4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic
输出样例:
Hot
2
And 1 more
一开始没注意到这个题有很多坑点,看了别人的代码后才明白
参考这个大佬的代码
STL真好,迭代器真好
别忘了getchar
#include<bits/stdc++.h>
using namespace std;
map<string,int> mp;
string s;
string set_string(string ss)
{
string cnt;
bool is_repeat=false;
for(int i=0; i<ss.length(); i++)
{
if(ss[i]>='A'&&ss[i]<='Z')
{
cnt+=(ss[i]-'A'+'a');
is_repeat=false;
}
else if((ss[i]>='a'&&ss[i]<='z')||(ss[i]>='0'&&ss[i]<='9'))
{
cnt+=ss[i];
is_repeat=false;
}
else if(!is_repeat)
{
cnt+=' ';
is_repeat=true;
}
}
if(cnt[cnt.length()-1]==' ')
cnt.erase(cnt.end()-1);
return cnt;
}
string cmp(string s1,string s2)
{
return s1<s2?s1:s2;
}
int main()
{
//freopen("in.txt","r",stdin);
int n;
cin>>n;
getchar();//又特么的忘了
while(n--)
{
map<string,int> small_map;
string ss;
getline(cin,s);
for(int i=0; i<s.length(); i++)
{
ss="";
if(s[i]=='#')
{
i++;
while(s[i]!='#')
ss+=s[i++];
ss=set_string(ss);
}
if(ss=="")
continue;
small_map[ss]++;
}
map<string,int>::iterator it;
for(it=small_map.begin(); it!=small_map.end(); it++)
{
mp[it->first]++;
}
}
int maxn=0,repeat=0;
map<string,int>::iterator it;
for(it=mp.begin();it!=mp.end();it++)
{
if(it->second>maxn)
{
maxn=it->second;
s=it->first;
repeat=0;
}
else if(it->second==maxn)
{
s=cmp(s,it->first);
repeat++;
}
}
cout<<(char)(s[0]-'a'+'A');
for(int i=1;i<s.length();i++)
cout<<s[i];
cout<<endl<<maxn<<endl;
if(repeat)
cout<<"And "<<repeat<<" more ..."<<endl;
}
更多PTA代码请到我的博客里参考
ps:代码仅供参考,请勿抄袭
…