spark程序入门 - 代码天地

spark程序入门

其他 2019-03-28 21:28:20 阅读次数: 0

package com.qf.gp1707.day06

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object SparkWC {
  def main(args: Array[String]): Unit = {
    //配置信息类
    val conf: SparkConf = new SparkConf().setAppName("SparkWC")//.setMaster("local[*]")
    //上下文对象
    val sc: SparkContext = new SparkContext(conf)
    //wc下可以只放入简单一个文件测试，文件参考如下wc1.log
    //读取数据  注意此处需要在idea中配置运行参数 参考我的arg0:hdfs://192.168.88.131:9000/wc/
    // age1:hdfs://192.168.88.136:9000/wc1/
    val lines = sc.textFile(args(0))

    //处理数据
    val words: RDD[String] = lines.flatMap(_.split(" "))
    val paired: RDD[(String, Int)] = words.map((_, 1))
    val reduced: RDD[(String, Int)] = paired.reduceByKey(_+_)
    val res: RDD[(String, Int)] = reduced.sortBy(_._2, false)

    //保存数据
    res.saveAsTextFile(args(1))

    println(res.collect().toBuffer)

    //结束任务
    sc.stop()
  }
}

参考日志文件如下：

Hello tom
Hello jerry
Hello tom
Hello kitty
Hello tom
Hello jerry

运行结果如下：
ArrayBuffer((hello,6), (tom,3), (jerry,2), (kitty,1))

猜你喜欢

转载自blog.csdn.net/weixin_40903057/article/details/88422920

spark入门程序WordCount

spark程序入门

Spark Java程序案例入门+Spark Window环境搭建

spark程序入门-wordCount详解总结

Spark : Spark入门

【Spark】(一) Spark入门

spark入门

spark 入门

【spark入门】

Spark入门（二）：打包程序、提交任务到集群

Spark入门：第一个Spark应用程序：WordCount

Spark快速入门系列(8) | 在IDEA上编写Spark程序的两种运行方式

[Spark]Spark入门资料阅读

Spark入门(五)——Spark Streaming

Spark入门三部曲之第三步Spark程序的开发和运行及WordCount

大数据篇：Spark入门第一个Spark应用程序详解：WordCount

Apache Spark 入门简介

Spark 实战入门

Spark 快速入门

Spark 入门知识学习

Apache Spark 入门

Spark入门之WordCount

Spark Streaming入门

Spark入门helloword

①Spark入门-环境搭建

Spark wordcount入门

Spark入门及安装与配置

Spark Sql快速入门

spark快速入门（四）

Spark入门及Java Api

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)