SparkShell启动(DataFrame的创建)

其他 2020-03-01 22:44:46 阅读次数: 0

[root@hdp-1 bin]# ./spark-shell --master spark://hdp-1:7077 --executor-memory 500m --total-executor-cores 1 --driver-class-path /root/Jar_File/mysql-connector-java-5.1.39.jar

一定要加载MySQL的驱动包，不然创建Dataframe会报错误

在spark-shell中提供的sparksession对象是spark，sparkcontext对象时sc.

在创建DataFrame之前，为了支持RDD转换为Dataframe及后续的sql操作，需要通过improt语句(即 import spark.implicits._)导入相应的包，启用隐式转换。

可以通过spark.read创建Dataframe

例如：spark.read.json("file:///root/people.json") 这里是文件路径

spark.read.csv("file:///root/people.csv")

spark.read.parquet("file:///root/people.parquet")

蔡培育的小弟

发布了85 篇原创文章 · 获赞 3 · 访问量 2530

私信关注

猜你喜欢

转载自blog.csdn.net/Romantic_sir/article/details/103318599

SparkShell启动(DataFrame的创建)

创建DataFrame

DataFrame的创建

DataFrame(4)：DataFrame的创建方式

从rdd创建dataframe

在DataFrame中创建MultiIndex

DataFrame概念与创建

Pandas ， series 与 Dataframe的创建

Pandas 字典创建dataframe

pandas—DataFrame创建

创建DataFrame的几种方式

DataFrame创建方式

Spark创建空的DataFrame

Spark的DataFrame创建实例

Spark之DataFrame创建

DataFrame创建数据

pySpark创建空DataFrame

从RDD创建DataFrame（Sparksql）

DataFrame的几种创建方式

创建DataFrame的多种方式

快速创建dataframe

python创建dataframe

⑨SparkSQL-创建DataFrame

spark创建空dataframe

DataFrame创建程序&利用字典创建dataframe对象

PySpark DataFrame创建透视表

DataFrame对象的创建，修改，合并

Spark创建DataFrame的几种方式

sparkSql 创建dataFrame几种方式

python DataFrame创建及基本操作

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)