Spark是常用的处理大规模数据的计算引擎。近年来,由于数据处理速度快,更易上手使用等特点,Spark正在被越来越多的企业所使用。所以,对于数据领域从业者来说,Spark数据分析几乎是必知必会的技能。
基于此,我们将七月在线的【Spark大数据实战】课程的内部课件,分享给诸位,这次分享的是这门课前两节课程的课件,前两节课件以带领大家入门Spark为主。如果对课程感兴趣,点击文末阅读原文即可。
目录:
大数据入门概述
a. 大数据技术发展史
b. 大数据的应用以及未来
c. hadoop生态圈介绍
d. hadoop框架演变与发展
e. 大数据存储系统hdfs原理解析
f. map-reduce原理解析
g. 分布式资源管理yarn原理解析
2. spark技术栈发展概述
a. spark的前世今生
b. spark1.X 技术栈概述
c.spark2.4 技术栈概述
d. spark3.0以及未来的展望
e. spark在大公司的应用
以下是 PPT 全文
转载于:https://www.jianshu.com/p/ae43b5cfa91d