spark分发jar包性能调优 - 代码天地

spark分发jar包性能调优

其他 2018-06-25 15:13:32 阅读次数: 2

首先spark有四种运行方式：

本地模式：spark单机运行
Standalone模式：构建一个由Master+Slave构成的Spark集群，Spark运行在集群上
Spark on Yarn 模式： spark直接连接Yarn，不需要额外构建Spark集群
Spark on Mesos模式：spark直接连接Mesos，不需要额外构建Spark集群

Spark程序在运行Yarn上：
在YARN相关模式中，运行库和程序运行所以来的其他文件首先通过HDFS客户端API上传到作业的.sparkStaing目录下，然后将对应的文件和URL映射关系通知YARN，YARN的Node Manager在启动Container的时候会从指定URL处下载相关文件作为运行环境的一部分。

调优部分是指：我们spark运行所需的jar包事先上传到HDFS上，然后在spark-default.conf 中配置
spark.yarn.jar=hdfs:///jar/spark-assembly-1.6.3-hadoop2.6.0.jar
这样就避免了每次都在重复上传这个jar包

猜你喜欢

转载自blog.csdn.net/qq_32635069/article/details/79831571

spark分发jar包性能调优

spark性能调优

Spark的性能调优

Spark 性能调优

Spark：性能调优

Spark调优之性能调优

Spark调优--性能调优

spark性能调优——开发调优

Spark调优-防止不必要的jar包上传与分发

Spark调优-防止不必要的jar包上传与分发

Spark Streaming：性能调优

Spark Streaming 性能调优

Spark的性能调优杂谈

Spark性能调优—高级

Spark性能调优总结

Spark SQL性能调优

Spark（七）————性能调优

spark sql 性能调优

Spark Streaming性能调优

Spark——性能调优——Shuffle

Spark 常规性能调优

Spark的性能调优(1)

Spark常规性能调优

Spark Core（十九）Spark性能的调优

Spark性能调优之常规性能调优（一）

Spark性能调优之数据倾斜调优

spark性能调优之开发调优

spark性能调优指南（四）（shuffle调优）

Spark性能调优之资源参数调优

Spark性能调优之 Shuffle调优（三）

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)