学习笔记(67):第二章：海量数据的处理与挖掘-Map Reduce思想变换数据key-value_05 - 代码天地

学习笔记(67):第二章：海量数据的处理与挖掘-Map Reduce思想变换数据key-value_05

其他 2020-02-27 09:06:01 阅读次数: 0

立即学习:https://edu.csdn.net/course/play/26303/334550?utm_source=blogtoedu

上面是在map和reducer之间加了combiner，增加了任务性能

总结：

1. reduce需要写函数，map有时候不用写

2. map工作主要修改key，reducer主要修改values

3. 对已有的算法惊醒map-reducer化

4. map对一个键值对输入产生一序列中间键值对

5. map函数将对所有输入键值对操作

6. 相同的key值被reducer放在一起，reducer函数对每一个不同的key进行操作

7. map和reducer属于分治思想，通过hash分桶来处理，map是发散过程，reducer是收敛过程

扫描二维码关注公众号，回复： 9433192 查看本文章

8. map任务数目远大于reducer

9. map-reducer会有输入输出，输出后再次进入map-reducer，如此循环迭代，在磁盘级别的操作，所以开销会很大，spark是在内存级别的操作，所以对内存开销会很大，但速度很快

10. spark稳定不如map，spark只读一次

11. map-reducer主要做特征的转换，数据的提取，转换，处理写入

12. 做特征的用map，reduce，导出的特征用于机器学习训练的用spark建模，用hadoop streaming方便任何语言编写map-reducer

果儿_wj

发布了73 篇原创文章 · 获赞 3 · 访问量 737

私信关注

猜你喜欢

转载自blog.csdn.net/wj1408421029/article/details/104519260

学习笔记(67):第二章：海量数据的处理与挖掘-Map Reduce思想变换数据key-value_05

学习笔记(66):第二章：海量数据的处理与挖掘-Map Reduce思想变换数据key-value_03

学习笔记(70):第二章：海量数据的处理与挖掘-关联规则挖掘01

学习笔记(68):第二章：海量数据的处理与挖掘-Hive在数据统计分析中持久化应用01...

数据挖掘学习笔记-第二章数据预处理

数据仓库与数据挖掘学习笔记第二章联机分析处理

《数据挖掘概念与技术》学习笔记-第二章

数据挖掘导论笔记1——第二章：数据

数据挖掘概念与分析第二章笔记

【数据挖掘与商务智能决策】第二章特征工程与数据预处理

数据挖掘读书笔记--第二章：认识数据

机器学习与数据挖掘-作业二-第二章模型评估与选择

大话数据结构第二章学习笔记

数据挖掘习题选做--第二章

Python数据分析与挖掘实战——第二章

数据挖掘导论课后习题答案-第二章

【深度学习】第二章：数据

2021-10-12 数据挖掘-实用机器学习工具与技术》—— 学习笔记第二章输入：概念、实例和属性

第二章-大数据处理框Hadoop

第二章：大数据处理架构Hadoop

数据挖掘day18、19-《数据挖掘导论》-第一章，第二章

《python数据分析与挖掘实战》第二章 python数据分析简介

ＪAVA数据结构和算法（第二章）学习笔记

网络是怎样连接的学习笔记-第二章-收发数据(上)

python《数据科学入门》学习笔记第二章 2018-8-17开始

Java 学习笔记：第二章数据类型和运算符

关系模式介绍——《数据库系统概念》第二章学习笔记

学习笔记(53):第二章：特征工程-通过真实数据观察大局

《数据结构与算法分析》学习笔记-第二章-算法分析

数据结构学习笔记第二章线性表

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)