Spark编程中函数的传递 - 代码天地

Spark编程中函数的传递

其他 2019-10-27 22:13:02 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/qq_40713537/article/details/101450149

Spark 进行编程的时候, 初始化工作是在 driver端完成的, 而实际的运行程序是在executor端进行的. 所以就涉及到了进程间的通讯，下面的实例演示函数的传递

import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.rdd.RDD

object SerDemo {
    def main(args: Array[String]): Unit = {
        val conf: SparkConf = new SparkConf().setAppName("SerDemo").setMaster("local[*]")
        val sc = new SparkContext(conf)
        val rdd: RDD[String] = sc.parallelize(Array("hello world", "hello atguigu", "atguigu", "hahah"), 2)
        //传递Searcher函数到exector端
        val searcher = new Searcher("hello")
        val result: RDD[String] = searcher.getMatchedRDD1(rdd)
        result.collect.foreach(println)
    }
}
//需求: 在 RDD 中查找出来包含 query 子字符串的元素

// query 为需要查找的子字符串
class Searcher(val query: String) extends Serializable{
    // 判断 s 中是否包括子字符串 query
    def isMatch(s : String) ={
        s.contains(query)
    }
    // 过滤出包含 query字符串的字符串组成的新的 RDD
    def getMatchedRDD1(rdd: RDD[String]) ={
        rdd.filter(isMatch)  //
    }
    // 过滤出包含 query字符串的字符串组成的新的 RDD
    def getMatchedRDD2(rdd: RDD[String]) ={
        rdd.filter(_.contains(query))
    }
}

猜你喜欢

转载自blog.csdn.net/qq_40713537/article/details/101450149

Spark编程中函数的传递

Spark之【RDD编程】详细讲解(No4)——《RDD中的函数传递》

shell编程：向函数中传递参数

Spark中RDD的函数传递——实现Serializable序列化

Spark Submit给jar包中的main函数传递参数

Spark深入解析（十二）：RDD中的函数传递

Spark Core快速入门系列(5) | RDD 中函数的传递

Spark编程指南之二：向Spark算子传递函数

Spark2.3.1 函数传递

Java中的函数传递

函数中参数的传递

Spark——传递函数与闭包

Spark中的编程模型

Spark编程模型(中)

Spark 编程模型(中)

函数中，指针的传递和变量的传递

python中函数传递参数是值传递还是引用传递

ode中函数参数传递

Python中函数参数传递

js函数中参数的传递

python中函数的参数传递

python函数中参数的传递

python 函数中的参数传递

js中函数的传递参数

10 spark中的DataFrame编程

Python中函数的引用传递，递归传递和匿名函数

Spark的RDD函数传递、依赖关系、缓存及CheckPoint

JS中的函数：函数参数传递

spark中flatMap函数用法

spark中的combineByKey函数的用法

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)