一点传统代码思维和大数据代码思维感悟 - 代码天地

一点传统代码思维和大数据代码思维感悟

其他 2020-04-12 10:31:32 阅读次数: 0

传统代码统计单词数量

读入文本，使用 BufferedReader, FileReader，按行存入 List
针对每一行，按空格做切割，并使用 Map，key 记录为单词，value 记录为数量，并且，检查 map 是否已经包含这个 key，如果包含，则将 value 增加 1
输出 map 的 key，和 value，得到单词数量

Spark RDD 代码统计单词数量

读入文本，使用 textFile
做 flatMap 操作，单词拆成独立的元素；做 pair 操作，单词组成键值对，初始值为 1；做 reduceByKey 操作，合并同类单词，并实现数量相加
做 foreach 操作，输出单词数量

我们发现，传统代码在进行操作时，比较依赖程序员的经验，可以按照上面的方式，也可以仿照 RDD 方式，比如第二步，可以把所有单词存入一个 List，然后再遍历 List，用 Map 来计数

但是 RDD 的每一步转换，都向着终点迈进，它是类似 Map Reduce 这样的模式来进行的，每一步就像一个 DAG 的节点，完成一个工作流程，更加适合集群计算

如果习惯了传统方式开发代码，要转变到 RDD 方式开发，需要有一个转变适应的过程。最好一开始就采用画图的方式来帮助分析结果的达成。

另外，不得不提一句的是，初学者使用 Java 来学习 Spark，更能有助于理解 transformation 操作，因为 Java 对类型的强要求，能够看到每一步的参数类型表示什么意思。如果一开始使用 Python 或者 Scala，反而容易迷糊。

henry.Woo

发布了27 篇原创文章 · 获赞 3 · 访问量 5653

私信关注

猜你喜欢

转载自blog.csdn.net/candyngwh/article/details/94428020

一点传统代码思维和大数据代码思维感悟

提升代码思维和能力的办法

关于自学activiti流程引擎的一点点感悟和代码分享

一点感悟

一点感悟...

【一点感悟】

看了后让你代码思维和能力提升的 Java 源代码

可以较大的提升我们代码思维和能力的Java源代码有哪些？

C#基本知识的一点感悟（2）——从源代码到中间语言

移动思维和WEB思维

计算思维和经济思维

数学思维和计算思维

那些让你代码思维和能力有较大的提升Java源码侵立删

一点学习感悟

一点小感悟

杂谈，一点感悟

最近的一点感悟

对疫情的一点感悟

有哪些 Java 源代码看了后让你收获很多，代码思维和能力有较大的提升？有哪些 Java 源代码看了后让你收获很多，代码思维和能力有较大的提升？

【产品思维】开篇：一点浅见

个人总结一点开发规范（思维）

有哪些 Java 源代码看了后让你收获很多，代码思维和能力有较大的提升？

ef core数据迁移的一点小感悟

大数据时代的思维变化（一）

大数据思维导图(一)JavaSE

用户思维与流量思维，最大的一点区别是什么呢？

大数据的思维方式

大数据思维

大数据思维原理

聊聊测试的强势思维和弱势思维

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)