现在有十万个单词，请你找出重复次数最多的十个。 - 代码天地

现在有十万个单词，请你找出重复次数最多的十个。

其他 2021-03-29 17:57:48 阅读次数: 0

字符串,最大长度4个G，乘以10万个…
思路一
我们不能直接在内存里操作
可以拆分成n多个文件
以长度区分，不同长度放在不同的文件夹
以首字母区分，不同首字母放在不同文件夹
以为字母区分，不同尾字母放在不同文件
这样一来，每个文件的每个数据长度相同且首字母尾字母也相同
接着从元素个数最多的文件开始,若找到的最多重复元素比剩下的文件元素长度(元素长度可藏在文件名中)则直接返回该字符串(最长之一)
若没有，则将每个文件的最多重复字符串，记录在另一个文件
最后对该文件进行查找找到最多重复字符串
首先采用从左往右单位排序的算法
每次筛出出现次数最大的字母，丢弃其他字母单词
如此循环直至遇到末尾字符，此时记录以键值对形式储存该字符串及其出现次数到另一个文件中
最终，找到出现次数最多的前10个字符串
思路二
采用桶的思想，不过10万个字符串，最坏情况可能需要10万个桶，因此，我们需要将他们放在不同目录下，避免单目录下10万个桶电脑卡死，比如我们每层目录26个子目录a-z，按字符串从左往右创建目录，小于10万个文件夹，一个3个字节，如此数据量就变成小于30万个字节，最终以单词字符串|次数命名文件，每次遍历到该字符串，次数+1，最终产生10个节点，储存最长10个字符串及其出现次数
采用有序单链表过滤(此处参考我上次的100个结点过滤1E个数字https://editor.csdn.net/md/?articleId=113199734)筛出最长10个字符串

猜你喜欢

转载自blog.csdn.net/weixin_43158695/article/details/113663365

现在有十万个单词，请你找出重复次数最多的十个。

十万个数据,找出重复次数最多的十个数据并打印

Java——十万个随机数求出里面重复次数最多的十个数

Java——从两个文件读取数据并找出它们重复次数最多的十个数

小练习——读取文件中重复次数最多的十个数据

技术方案解决：海量日志数据__怎么在海量数据中找出重复次数最多的一个

从一个字符串中找出重复次数最多的字符？

数组-----找出数组中重复次数最多的数

找出两个数组中都有，并且重复次数最多的元素

10万个随机数据中选出重复次数最多的10组

计算重复次数最多的

JAVA找出List集合中重复次数最多的数据和次数

数据结构——数组（3）在有序数组中找出重复的次数最多的数

找出字符串中，连续重复次数最多的字符

统计nginx日志里访问次数最多的前十个IP

统计Apache或nginx日志里访问次数最多的前十个IP

SQL:查询重复次数最多的名字和id

mysql 查询重复次数最多/最少的几条记录

【编程题】寻找重复次数最多的数

map查找重复次数最多的数字

输出字符串中重复次数最多的字符和重复次数。

现在有一个函数A和函数B，请你实现B继承A

把100000个随机数存进指定文件中，并读取出这100000个数中重复次数最多的10个数

找到《飘》中次数最多的N个单词

面试题--在一个字符串中查找重复次数最多的字符（转）

Repeats SPOJ - REPEATS（重复次数最多的连续重复子串）

Maximum repetition substring POJ - 3693（重复次数最多的连续重复子串）

POJ 3693 （重复次数最多连续重复子串）

Repeats spoj 687 后缀数组求重复次数最多的连续重复子串

POJ - 3693 Maximum repetition substring（重复次数最多的连续重复子串）

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)