Spark使用示例：分别使用client模式和cluster运行SparkPi程序 - 代码天地

Spark使用示例：分别使用client模式和cluster运行SparkPi程序

其他 2019-05-02 00:02:23 阅读次数: 0

版权声明：本文为博主原创文章，如需转载，请注明出处： https://blog.csdn.net/MASILEJFOAISEGJIAE/article/details/89317964

温馨提示：运行前，要先开启Hadoop和YARN：./start-all.sh

运行SparkPi程序（Client模式）

进入spark目录，执行SparkPi程序（Client模式）

/home/hadoop/app/spark-2.1.0-bin-2.6.0-cdh5.7.0/bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--executor-memory 1G \
--num-executors 1 \
--num-executors 1 \
/home/hadoop/app/spark-2.1.0-bin-2.6.0-cdh5.7.0/examples/jars/spark-examples_2.11-2.1.0.jar \
4

结果报错：
Exception in thread "main" java.lang.Exception: When running with master 'yarn' either HADOOP_CONF_DIR or YARN_CONF_DIR must be set in the environment.

错误原因：如果想运行在YARN之上，就必须要设置HADOOP_CONF_DIR 或者是YARN_CONF_DIR

解决方法：控制台中执行
export HADOOP_CONF_DIR=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop

客户端模式输出结果，会在控制台展示

运行SparkPi程序（Cluster模式）

执行Cluster模式的命令，只需要将--master的参数变为yarn-cluster

/home/hadoop/app/spark-2.1.0-bin-2.6.0-cdh5.7.0/bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn-cluster \
--executor-memory 1G \
--num-executors 1 \
--num-executors 1 \
/home/hadoop/app/spark-2.1.0-bin-2.6.0-cdh5.7.0/examples/jars/spark-examples_2.11-2.1.0.jar \
4

使用cluster模式，控制台上面是没有输出结果的。

法一：使用yarn logs -applicationId application_1555386440422_0002
法二：网页上看：

猜你喜欢

转载自blog.csdn.net/MASILEJFOAISEGJIAE/article/details/89317964

Spark使用示例：分别使用client模式和cluster运行SparkPi程序

spark集群中运行SparkPi的示例

MyBatis #{} 和 ${} 的分别使用和区别

Flink从入门到真香（1-分别使用流模式和批模式运行第一个demo)

Spark Client和Cluster两种运行模式的工作流程

VC++分别使用WinExec、CreateProcess、ShellExecute和ShellExecuteEx来启动程序（附源码）

各模式下运行spark自带实例SparkPi

分别使用Matlab和OpenCV标定微距相机

winform和wpf下分别使用zedgraph控件

TCP、UDP的区别和分别使用的场合

分别使用POI和JXL导出数据到Excel

分别使用 css 和 js 实现平滑滚动

作业9：分别使用numpy和pytorch实现BPTT

Spark 的 Yarn-cluster 模式和 Yarn-client 模式

Spark 在YARN上运行，以集群模式启动Spark应用程序：spark-submit --class org.apache.spark.examples.SparkPi \ 。。。如何查看结果？

Spark运行模式_Spark自带Cluster Manager的Standalone Client模式（集群）

Androidstudio中的控件颜色分别使用

Spark运行模式(local standalond,yarn-client,yarn-cluster,mesos-client,mesos-cluster)

大话Spark(5)-三图详述Spark Standalone/Client/Cluster运行模式

Spark on yarn工作模式。 Client和Cluster两种运行模式的工作流程、基本概念。spark工作流程

Spark on YARN cluster & client 模式作业运行全过程分析

安卓程序开发——数据持久化应用分别使用getSharedPreferences，getPreferences，PreferenceManager.getDefaultSharedPreferences

分别使用js和JQuery实现全选和全不选

Flink实战-订单支付和对账情况监控（分别使用CEP和ProcessFunction来实现）

原生JS和jQuery分别使用jsonp来获取“当前天气信息”

分别使用JS和JQ获取想要input元素的方法

分别使用js原生代码和jQuery实现瀑布流效果

分别使用simpleAdapter和baseAdapter为ListView的Item添加按钮响应事件

分别使用原生Ajax 和Jquery的方式实现数据请求

渲染一颗树（分别使用vue和react创建）

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)