SPARK算子实例SCALA实现（take,SavaASTextFile,CountByKey） - 代码天地

SPARK算子实例SCALA实现（take,SavaASTextFile,CountByKey）

其他 2018-05-08 23:00:00 阅读次数: 3

package day06
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.rdd.RDD
import scala.collection.Map

object MyAction_Scala_2 {
   def myTake(sc:SparkContext){
     val RDD1 = sc.parallelize(List("aa", "bb", "cc"))
  val array: Array[String] = RDD1.take(2)
    array.toList.toString
   }


  def mySaveASTextFile(sc:SparkContext): String ={
    val parallelizeRDD:RDD[String]=sc.parallelize(List("hello world","hello scala"))
    val flatMapRDD:RDD[String]=parallelizeRDD.flatMap(_.split(" "))
  //flatMapRDD.saveAsTextFile("D://3.txt")
    flatMapRDD.saveAsTextFile("hdfs://hadoop-1707-001:9000/save/test000")
    "保存成功"
  }
  //统计集合key出现的次数
  def myCountByKey(sc:SparkContext): Unit ={
    var array: Array[(String, String)] = Array(Tuple2("class2","liao"),Tuple2("class2","ao"),Tuple2("class2","li"),Tuple2("class1","lao"))
     var parallelizeRDD: RDD[(String, String)] = sc.parallelize(array)
      var countByKeyRDD: Map[String, Long] = parallelizeRDD.countByKey()
        for((k,v)<-countByKeyRDD){
          println("key="+k,"value="+v)
        }

  }

  def main(args: Array[String]) {
    val conf: SparkConf = new SparkConf().setMaster("local").setAppName("MyAction_scala_2")
    var sc: SparkContext = new SparkContext(conf)
    myCountByKey(sc)
    // myTake(sc)
    //mySaveASTextFile(sc)
   sc.stop()
  }
}

猜你喜欢

转载自blog.csdn.net/wjn19921104/article/details/80230283

SPARK算子实例SCALA实现（take,SavaASTextFile,CountByKey）

SPARK算子实例JAVA实现（take,CountByKey,SaveAsTextFile）

spark 算子实例

SPARK算子实例JAVA实现（reduce）

Spark RDD 常用算子实例解析

spark算子实现词频统计（java版和scala版）

spark：distinct算子实现原理

java实现spark常用算子之Take

用JAVA简单实现Spark转换算子实例（reduceByKey,sortByKey,join,cogroup）

spark中的算子（ mapPartitionsWithIndex ，coalesce，zipWithIndex，zip，countByKey，countByValue，reduce等）【Scala】

Spark中countByKey算子详解介绍

spark通过combineByKey算子实现条件性聚合的方法

Spark RDD算子实战

Spark RDD算子之PairRDD的Action操作 -- countByKey、collectAsMap

Spark RDD算子实例——统计广告点击量 Top3

大数据：wordcount案例RDD编程算子，countByKey，reduce，fold，first，take，top，count，takeSample，takeOrdered

Spark : Scala算子分类

Spark-Scala算子

spark使用状态函数updateStateByKey算子实现数据入库

RDD算子实现文件统计

spark转换算子求交集SCALA实现（insertsection）

Spark算子：RDD行动Action操作(2)–take、top、takeOrdered

Spark core算子aggregateByKey实例

Opencv之利用matchshape算子实现简单的形状匹配

构建高效物理计划：从逻辑查询到算子实现

使用opencv的Sobel算子实现图像边缘检测

使用opencv的Laplacian算子实现图像边缘检测

Spark常用transformation算子操作 —— Scala版

Spark常用action算子操作 —— Scala版

Spark ML 特征转换及处理算子实战技巧-Spark商业ML实战

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)