pyspark 向HDFS存json

其他 2021-11-18 07:44:39 阅读次数: 0

文章目录

hdfs包提交
向HDFS读写json

hdfs包提交

链接: https://pan.baidu.com/s/12EsTYabf9ivxV0nLQ4yxYQ 提取码: aids 复制这段内容后打开百度网盘手机App，操作更方便哦

下载我分享的hdfs.zip即可，集群提交

PYSPARK_PYTHON=/data/anaconda3/bin/python3 \
/opt/spark/bin/spark-submit \
    --master yarn \
    --deploy-mode client \
    --py-files /xxx/hdfs.zip \
    XXX.py >>./log/XXX.log 2>>./log/XXX.err

向HDFS读写json

hdfsConn = Client('http://172.00.100.00:9870', root='/xxx/xxx', timeout=1000, session=False)

di = {
    
    'dw': 0, 'd2w': 1, 'dw1': 2}
di=str(di)
print(di)

# 写入json
hdfsConn.write('/user/renwanxin/ad_ctr_test/data/user_modelMake222.json', data=di, overwrite=True, append=False)

# 读json
di = []
with hdfsConn.read('/user/renwanxin/ad_ctr_test/data/user_modelMake222.json', encoding='utf-8', delimiter=',') as f:
    for line in f:
        di.append(line)
di = ','.join([x for x in di])
print(dict(di))
# print(eval(di))

{'dw': 0, 'd2w': 1, 'dw1': 2}
{'dw': 0, 'd2w': 1, 'dw1': 2}

猜你喜欢

转载自blog.csdn.net/qq_42363032/article/details/119917005

pyspark 向HDFS存json

pyspark程序从hdfs上读取数据求其TopN，并将结果存回hdfs

pyspark-hdfs数据操作函数介绍

Pyspark获取hdfs上多个文件

pyspark单词统计(python编写)文件在hdfs上

python pyspark-submit 保存模型到hdfs（全网之最）

pyspark系列--连接pyspark

【pyspark】一 dataframe 读写parquet、json、csv等文件

spark- PySparkSQL之PySpark解析Json集合数据

PySpark操作

pyspark LDA

pyspark NaiveBayes

pyspark 浅析

pyspark 报错

mapreduce(pyspark)

PySpark的原理

pyspark streaming

pypy on PySpark

PySpark教程

PySpark（一）

pyspark -- DataFrame

PySpark DataFrame

pyspark logistic

pyspark的用法

pyspark与Mongodb

pyspark API

pyspark：GBDT

pyspark:FPgrowth

PySpark实践

pyspark 操作

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)