Dataframe保存文件 - 代码天地

Dataframe保存文件

其他 2020-04-08 23:03:48 阅读次数: 0

网上查看了Dataframe如何把结果保存成文件经过尝试都以失败告终，大多数的博客上写的都是使用：在spark-shell模式下先导入 import org.apache.saprk.sql.SaveMode 的包，然后 result.repartitione(1).save("…/out.json",“json”,SaveMode.Overwrite) 这样的方式来保存结果，我无论怎么尝试都是报错

在这里插入图片描述

不知道是版本问题还是什么原因，都是save的错，本人使用的版本Spark-2.4.3 ，hive-2.3 .4，望有朋友找到解决这个问题的原因告知一下，在此谢过。

回归正题既然问题出在save上咋就想着不用它了找其他方法替代于是使用以下办法

这里的re是我已经处理好的结果的常量

re.write.mode(SaveMode.Overwrite).json("result.json")

发现没报错真是太好
在这里插入图片描述
查看文件发现把我结果的每一列作为一个文件存储

要合成一个文件来存储就要加上repartition(1)或者coalesce(1)

在这里插入图片描述

存储在本地的方式

re.repartition(1).write.csv("file:/root/out")

在这里插入图片描述

路由已

发布了39 篇原创文章 · 获赞 13 · 访问量 2302

私信关注

猜你喜欢

转载自blog.csdn.net/qq_43205282/article/details/103970798

Dataframe保存文件

SparkSQL保存DataFrame为CSV文件

Dataframe保存模式

dataframe保存至csv乱码

pandas 将多个dataframe保存为一个excel文件的多个sheet表中

55_Pandas.DataFrame 转换为 JSON 字符串/文件并保存 (to_json)

【人工智能概述】pandas拼接文件，np保留小数点后几位，np数据转化成pd.DataFrame数据，读取DataFrame的列名，把DataFrame保存成csv文件，删除某个文件

pandas 之 DataFrame 保存为文件 (df.to_csv、df.to_json、df.to_html、df.to_excel)

DataFrame读取本地文件

spark DataFrame 读写和保存数据

Python中使用pandas保存dataframe

保存文件

文件的保存

DataFrame读取写入文件的方法

11.6 hdfs读取json数据，转成DataFrame保存到hdfs

tensorflow 训练格式TFRecord简单使用；spark dataframe保存TFRecord

pyspark 数据的读取与保存；pyspark的dataframe转化与展示

pandas 从txt读取DataFrame&DataFrame格式化保存到txt

dataframe

pyspark读取csv文件创建DataFrame

python转化日志文件到dataframe

pandas(DataFrame)运用在CSV文件上

编码格式处理、文件或dataFrame的操作

使用pandas读取文件并加工成DataFrame

dataframe转化为txt和csv文件

pandas 读取文件内容dataframe方法

pandas：DataFrame的属性和pandas文件的操作

python读取txt文件转为dataframe

android文件保存File

007新建与保存文件

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)