RDD编程实践

(1)spark-shell交互式编程:

根据某大学计算机系的成绩数据,完成编程,数据格式如下

 1.该系共有多少个学生:

首先新建RDD

 通过map函数与分割函数得到第一列数据作为新的RDD

 RDD去重

 行数

 2.该系共开设多少课程:

 3.求Tom同学的平均分:

通过filter函数进行筛选

 

 计算总数

 求平均数

 4.

猜你喜欢

转载自www.cnblogs.com/123456www/p/12307863.html