SparkSql常用命令操作 - 代码天地

SparkSql常用命令操作

其他 2018-12-08 09:11:07 阅读次数: 0

1、进入spark-shell模式

spark-shell --master yarn --executor-memory 4g --num-executors 3 --executor-cores 4

2、spark sql查询Hive数据库

import spark.sql

sql("use database_name”)

sql("show tables").show

3、读取hdfs文件数据

val data = spark.read.format("csv").option("sep", ",").option("header","true").load("file_path + file_name")

4、存储文件(默认hdfs路径)

data.write.format("csv").save("/data/....")

5、读取hive表数据

val res = spark.sql("select * from table_1 where day='20181230'")

6、注册成表

res.registerTempTable(“Res")

7、更换属性

val ss = data.selectExpr("_c0 as like","_c1 as session_id","_c2 as uid1”)

8、删除某列属性

val s1 = data.drop("_c0”)

9、一列转换成多列

val df2 =df1.withColumn("_corrupt_record",split(col("_corrupt_record"),","))

.select(col("_corrupt_record").getItem(0).as("uid"),col("_corrupt_record").getItem(1).as("number"))

10、过滤数字(三个横线)

val uid = df2.filter($"number"===1)

11、过滤空值

val s_1 = res.filter("like is not null").filter("session_id is not null”)

猜你喜欢

转载自blog.csdn.net/weixin_41362649/article/details/84665564

SparkSql常用命令操作

常用命令操作

maven的常用操作与常用命令

Linux常用命令与常用操作

常用命令|常用操作

Linux 常用命令操作

msyql操作常用命令

codis操作常用命令记录

linux操作常用命令

MYSQL操作常用命令大全

Mongodb-操作-常用命令

Mongo操作常用命令

linux 目录操作常用命令

linux的常用命令与操作

Linux文件操作常用命令

DBA操作常用命令

操作系统常用命令

vim常用命令操作

Docker 安装、操作常用命令

git常用命令和操作

操作linux redis 常用命令

Docker 常用命令与操作

Docker 镜像操作常用命令

Docker 容器操作常用命令

Kafka常用命令操作

linux常用命令及操作

laravel常用命令和操作

03 docker 常用命令的操作

vi常用命令操作

mac常用命令操作

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)