赵强老师:大数据从入门到精通(20)Spark RDD—116人已学习
课程收益
本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本全面介绍大数据的整体内容,让学员深入理解并掌握运行机制和原理,从而进一步掌握大数据的相关内容。
讲师介绍
赵强老师更多讲师课程
毕业于清华大学,拥有超过13年的工作经验。 Oracle认证讲师,拥有6年以上授课经验。精通Oracle数据库、中间(Weblogic)和大数据Hadoop的管理和开发,精通Java语言。 曾为湖北移动,北京市公安局,中国人寿,AutoDesk(中国)有限公司,成都运达科技股份有限公司,中国电信,中国移动,山东教育网进行培训。由于其认真负责的授课态度和基于本质的课程内容解释,深受学员的追捧。
课程大纲
第1章:Spark RDD
1.什么是RDD 21:38
2.RDD的算子 11:17
3.RDD基本算子示例 20:41
4.RDD的缓存机制 17:28
5.RDD的容错机制和检查点 13:44
6.RDD的依赖关系和Stage 13:00
第2章:RDD的高级算子
1.mapPartitionsWithIndex 10:41
2.aggregate(1) 15:53
3.aggregate(2) 20:19
4.aggregateByKey 10:11
5.coalesce和repartition 7:23
第3章:Spark编程案例
1.求网站访问量 21:43
2.自定义分区 23:48
3.访问关系型数据库 19:35
4.使用foreachPartition 13:44
5.使用JdbcRDD 11:16
大家可以点击【查看详情】查看我的课程
赵强老师:大数据从入门到精通(20)Spark RDD-赵强老师-专题视频课程
猜你喜欢
转载自blog.csdn.net/zhaoyuqiang/article/details/83580440
今日推荐
周排行