Spark之DataFrame创建

其他 2019-04-14 17:11:17 阅读次数: 0

DataFrame创建

在Spark SQL中SparkSession是创建DataFrame和执行SQL的入口，创建DataFrame有三种方式：通过Spark的数据源进行创建；从一个存在的RDD进行转换；还可以从Hive Table进行查询返回。

1）从Spark数据源进行创建

（1）查看Spark数据源进行创建的文件格式

scala> spark.read.

csv format jdbc json load option options orc parquet schema table text textFile

（2）读取json文件创建DataFrame

scala> val df = spark.read.json("/opt/module/spark/examples/src/main/resources/people.json")

df: org.apache.spark.sql.DataFrame = [age: bigint, name: string]

（3）展示结果

scala> df.show

+----+-------+

| age| name|

+----+-------+

|null|Michael|

| 30| Andy|

| 19| Justin|

+----+-------+

2）从RDD进行转换

3）从Hive Table进行查询返回

猜你喜欢

转载自blog.csdn.net/qq_43193797/article/details/89279616

Spark之DataFrame创建

Spark创建空的DataFrame

Spark的DataFrame创建实例

spark创建空dataframe

大数据之Spark Sql（二）：DataFrame、创建DataFrame、DataFrame API实现

spark笔记之DataFrame

Spark创建DataFrame的几种方式

Spark SQL之 Dataframe/Dataset

Spark之DataFrame操作大全

spark 通过传入List 创建DataFrame

Spark SQL中创建 DataFrame 方法

Spark创建SparkSession，dataframe常用操作

Spark-SQL之DataFrame操作大全

Spark笔记整理之RDD转化DataFrame

Spark-SQL之DataFrame操作

Spark之RDD与DataFrame互相转换

spark之DataFrame、DataSet、RDD的区别

spark笔记之DataFrame常用操作

Spark之RDD、DataSet、DataFrame转换

Spark DataFrame

【Spark】DataFrame

Spark 系列（八）—— Spark SQL 之 DataFrame 和 Dataset

[Spark]-RDD之创建

Spark之RDD的创建

Spark之RDD创建

Spark 中 DataFrame的三种创建方式

【Spark篇】---SparkSQL初始和创建DataFrame的几种方式

Spark SQL（二十一）DataFrame、DataSet的创建

Spark创建DataFrame的三种方法

Spark 创建RDD、DataFrame各种情况的默认分区数

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)