1 问题
Description
企业喜欢用容易被记住的电话号码。让电话号码容易被记住的一个办法是将它写成一个容易记住的单词或者短语。例如,你需要给滑铁卢大学打电话时,可以拨打TUT-GLOP。有时,只将电话号码中部分数字拼写成单词。当你晚上回到酒店,可以通过拨打310-GINO来向Gino’s订一份pizza。让电话号码容易被记住的另一个办法是以一种好记的方式对号码的数字进行分组。通过拨打必胜客的“三个十”号码3-10-10-10,你可以从他们那里订pizza。
电话号码的标准格式是七位十进制数,并在第三、第四位数字之间有一个连接符。电话拨号盘提供了从字母到数字的映射,映射关系如下:
A, B, 和C 映射到 2
D, E, 和F 映射到 3
G, H, 和I 映射到 4
J, K, 和L 映射到 5
M, N, 和O 映射到 6
P, R, 和S 映射到 7
T, U, 和V 映射到 8
W, X, 和Y 映射到 9Q和Z没有映射到任何数字,连字符不需要拨号,可以任意添加和删除。 TUT-GLOP的标准格式是888-4567,310-GINO的标准格式是310-4466,3-10-10-10的标准格式是310-1010。
如果两个号码有相同的标准格式,那么他们就是等同的(相同的拨号)
你的公司正在为本地的公司编写一个电话号码薄。作为质量控制的一部分,你想要检查是否有两个和多个公司拥有相同的电话号码。
Input
输入的格式是,第一行是一个正整数,指定电话号码薄中号码的数量(最多100000)。余下的每行是一个电话号码。每个电话号码由数字,大写字母(除了Q和Z)以及连接符组成。每个电话号码中只会刚好有7个数字或者字母。
Output
对于每个出现重复的号码产生一行输出,输出是号码的标准格式紧跟一个空格然后是它的重复次数。如果存在多个重复的号码,则按照号码的字典升序输出。如果输入数据中没有重复的号码,输出一行:
No duplicates.Sample Input
12
4873279
ITS-EASY
888-4567
3-10-10-10
888-GLOP
TUT-GLOP
967-11-11
310-GINO
F101010
888-1200
-4-8-7-3-2-7-9-
487-3279Sample Output
310-1010 2
487-3279 4
888-4567 3
题目地址poj 1002
2 思路分析
题目不难,可以把所有字符都转换成数字,然后使用STL map即可解决,主要是数据量上达到了10W,需要使用匹配表加快转换速度。
3 算法实现
第一次写出来的算法是转成数字字符串了,结果时间超出限制,不管怎么在优化也无法Accept,只好重新想思路了。
#include <iostream>
#include <cstdio>
#include <string>
#include <map>
using namespace std;
int main()
{
map<string, int> result;
int i, n;
cin >> n;
getchar();
for(i = 0; i < n; ) {
string s;
char ch;
int count = 0;
while(ch = getchar()) {
if(ch == '\n') {
i ++;
break;
}
// 把字符串转换成数字字符串
if(ch == '-') continue;
if(ch >= '0' && ch <= '9') s.push_back(ch);
if(ch >= 'A' && ch <= 'C') s.push_back('2');
if(ch >= 'D' && ch <= 'F') s.push_back('3');
if(ch >= 'G' && ch <= 'I') s.push_back('4');
if(ch >= 'J' && ch <= 'L') s.push_back('5');
if(ch >= 'M' && ch <= 'O') s.push_back('6');
if(ch >= 'P' && ch <= 'S') s.push_back('7');
if(ch >= 'T' && ch <= 'V') s.push_back('8');
if(ch >= 'W' && ch <= 'Y') s.push_back('9');
count ++;
if(count == 3) s.push_back('-');
}
result[s] ++;
}
bool flag = false;
// 项的数量大于1输出
map<string, int>::iterator it = result.begin();
for(; it != result.end(); ++ it) {
if(it->second > 1) {
flag = true;
cout << it->first << " " << it->second << "\n";
}
}
if(!flag) cout << "No duplicates.\n";
return 0;
}
最后想到也许分支判断过多和字符串匹配判断很消耗时间的原因,就使用纯数字代替数字字符串,在使用一个表来减少分支,成功通过测试,算法如下:
#include <iostream>
#include <cstdio>
#include <map>
using namespace std;
int main()
{
// 匹配表
int tables[] = {
2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5,
6, 6, 6, 7, 0, 7, 7, 8, 8, 8, 9, 9, 9
};
map<int, int> result;
int i, n;
cin >> n;
getchar();
for(i = 0; i < n; ) {
char ch;
int key = 0;
while(ch = getchar()) {
if(ch == '\n') {
i ++;
break;
}
// 优化成2个分支
if(ch >= '0' && ch <= '9') key = key*10 + ch - '0';
else if(ch >= 'A' && ch <= 'Y') key = key*10 + tables[ch - 'A'];
}
result[key] ++;
}
bool flag = false;
map<int, int>::iterator it = result.begin();
for(; it != result.end(); ++ it) {
if(it->second > 1) {
flag = true;
printf("%03d-%04d %d\n", it->first/10000, it->first%10000, it->second);
}
}
if(!flag) printf("No duplicates.");
return 0;
}