Spark入门（五）Spark SQL shell启动方式(元数据存储在derby) - 代码天地

Spark入门（五）Spark SQL shell启动方式(元数据存储在derby)

其他 2020-04-06 12:44:03 阅读次数: 0

一、spark-sql shell介绍

Spark sql是以hive SQL提交spark任务到spark集群执行。

由于spark是计算框架没有存储功能，所有spark sql数据表映射关系存储在运行shell的当前目录下metastore_db目录里面（spark默认使用derby数据库创建的本地存储，使用其他非本地数据库没有此目录），切换不同的目录启动spark-sql shell会创建不同位置的metastore_db目录存储关系数据。而且metastore_db目录在spark-sql shell里面访问权限是独占的，同一个目录只能启动一个spark-sql shell进程，多启动会报错。

二、启动spark-sql shell

--driver-class-path是指定driver程序启动数据库连接驱动类库

--jars是给worker执行调用的类库，需要指定数据库连接驱动类库

数据库连接驱动类库放在spark-sql机器的指定目录。也可以添加到spark集群每台机器的spark安装目录的jars目录下，这样就不用指定--driver-class-path --jars

cd ~/software/spark-2.4.4-bin-hadoop2.6
bin/spark-sql --master spark://hadoop01:7077,hadoop02:7077,hadoop03:7077 --driver-class-path /home/mk/mysql-connector-java-5.1.26-bin.jar  --jars /home/mk/mysql-connector-java-5.1.26-bin.jar

执行结果：

三、执行sql

（1）创建表

create table test(id int, name string)  
USING org.apache.spark.sql.jdbc 
options(url 'jdbc:mysql://192.168.150.1:3306/spark-mysql?user=root&password=admin', dbtable 'test_a');

show tables;

（2）插入数据

insert into test values(1, 'a'), (2, 'b'), (3, 'c');
select * from test;

（3）删除元数据表

drop table test;

茅坤宝骏氹

发布了364 篇原创文章 · 获赞 570 · 访问量 140万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/moakun/article/details/104123652

Spark入门（五）Spark SQL shell启动方式(元数据存储在derby)

Spark入门（六）Spark SQL shell启动方式(元数据存储在mysql)

Spark入门（七）Spark SQL thriftserver/beeline启动方式

spark shell hive sql

Spark Sql快速入门

Spark SQL入门

大数据-Spark SQL

大数据之Spark（五）--- Spark的SQL模块，Spark的JDBC实现，SparkSQL整合MySQL，SparkSQL整合Hive和Beeline

spark-sql入门（一）通过spark-shell命令行操作

Spark SQL:从入门到精通(五)[开窗函数]

Spark SQL:从入门到精通(五)[开窗函数]

Spark-Sql快速入门系列(4) | JDBC读写数据

Spark SQL｜Spark，从入门到精通

Spark -- Spark SQL 简介数据抽象

【Spark九十五】Spark Shell操作Spark SQL

Spark SQL从MySQL中加载数据以及将数据写入到mysql中 Spark Shell方式 Spark SQL程序

Spark DataFrame、Spark SQL、Spark Streaming入门教程

Spark SQL 入门应用 DataFrames

Spark SQL从入门到精通

Spark SQL（二十三）Spark SQL数据源

Spark SQL数据源

Spark SQL数据的读取和存储

Spark SQL:从入门到精通(二)[IDEA开发Spark SQL]

Spark SQL 快速入门系列(1) | Spark SQL 的简单介绍！

Spark on Hive【S负责SQL解析和优化（SparkSQL）、计算引擎；H只负责存储元数据；主流方式】、Hive on Spark【H负责SQL解析和优化、存储元数据；S充当计算引擎】

spark实验(五)--Spark SQL 编程初级实践(1)

Spark SQL

spark笔记-spark sql

Hive、Beeline、Spark-SQL、Spark-Shell CLI使用

【Spark】Spark SQL原理、编译、配置及运行方式详述

今日推荐

AI小程序有哪些？AI小程序哪个好用？微信小程序AI写作叫什么？免费的ai小程序推荐 ai写作小程序推荐

灵办AI工具(科研学术,代码编程,学习辅导,图书报告)功能介绍

Linux内核源码分析（非常详细）零基础入门到精通，收藏这一篇就够了

【C++篇】启航——初识C++（上篇）

数据飞轮崛起：数据中台真的过时了吗？

828华为云征文——使用Flexus云服务器X实例CentOS镜像下创建MySQL服务器教程

阿里巴巴出品的6款AI神器，你用过几个？

【机器学习】多模态AI——融合多种数据源的智能系统

HashiCorp 创始人向 Zig 软件基金会捐赠 30 万美元

1-8 月我国软件业务收入 85492 亿元，同比增长 11.2%

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

周排行

Ubuntu+apache2+php5+mysql+phpmyadmin的php环境搭建

基于YOLOv3+Kalman-Filter实现Multi-target tracking

解释C++实例化类的指针类型中的new

苹果手机页面不兼容问题——mui

Python基础语法

javascript学习笔记一【预解释】

python内置函数 map

【Git】使用webstorm操作git

this与super关键字（一）

python list 使用技巧

每日归档

更多

2024-10-04(63)

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)