将RDD转换为DataFrame，再换回RDD再查询几行看看 - 代码天地

将RDD转换为DataFrame，再换回RDD再查询几行看看

其他 2020-03-05 00:17:48 阅读次数: 0

sparkContext是针对RDD的读写，后面DataFrame用sparkSession
转换先得变成Row,Row是数据框的行对象，然后创建dataframe就行了
如果要查询,通过spark.sql，必须得注册成临时表才行
from pyspark.sql import Row
people = spark.sparkContext.textFile(“file:///文件目录”).map(lambda x:x.split(",")).map(lambda p:Row(name=p[0],age=int(p[1])))
schemap=spark.createDataFrame(people)
schemap.createOrReplace(TempView(“people”))#注意这里对象引用加引号了
peopleDF=spark.sql(“select name,age from people where age>20”)
peopleRDD=peopleDF.rdd.map(lambda p:“name:”+p.name+","+“age:”+str(p.age))
peopleRDD.foreach(print)

try to stay simple

发布了25 篇原创文章 · 获赞 0 · 访问量 381

私信关注

猜你喜欢

转载自blog.csdn.net/qq_45371603/article/details/104603909

将RDD转换为DataFrame，再换回RDD再查询几行看看

RDD转换为DataFrame

Spark-SQL之RDD转换为DataFrame

Dataset 的基础知识和RDD转换为DataFrame

配置sparksql读hive，dataframe和RDD，将RDD转换成Dataframe，视图，withcolumn

Spark将RDD转DataFrame

Spark将DataFrame转RDD

045 RDD与DataFrame互相转换

RDD、DataSet、DataFrame之间的转换

Spark RDD和DataSet与DataFrame转换成RDD

RDD转换为DataFrame的两种方式及spark sql的简单实例

RDD转换为DataFrame的时候报错：java.lang.NumberFormatException: For input string: ""

RDD使用编程接口方式转换为DataFrame的工具类（针对字段特别多的）

SparkSQL创建RDD：<4>动态创建Schema将非json格式的RDD转换成DataFrame【Java，Scala纯代码】

SparkSQL创建RDD：<3>通过反射的方式将非json格式的RDD转换成DataFrame【Java，Scala纯代码】

spark: RDD与DataFrame之间的相互转换

Spark-RDD、Dataset、DataFrame互相转换

Spark之RDD与DataFrame互相转换

RDD、DataFrame、DataSet对比与相互转换

RDD、DataFrame、DataSet对比与相互转换

RDD、DataFrame、DataSet对比与相互转换

spark中RDD和DataFrame之间的转换

RDD转换成为DataFrame

RDD、DataFrame与DataSet的相互转换

Spark之RDD、DataSet、DataFrame转换

Spark将RDD转换成DataFrame的两种方式

11.4 使用反射的方式将RDD转换成为DataFrame

Spark DataFrame及RDD与DataSet转换成DataFrame

Spark SQL将rdd转换为数据集-反射来推断Inferring the Schema Using Reflection

Spark SQL将rdd转换为数据集-以编程方式指定模式（Programmatically Specifying the Schema）

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)