spark-beeline导出hive表数据到csv方法，乱码原因及解决方案 - 代码天地

spark-beeline导出hive表数据到csv方法，乱码原因及解决方案

其他 2019-04-17 13:13:35 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/SunWuKong_Hadoop/article/details/87284904

亲测语句1：

spark-beeline -u jdbc:hive2://10.254.1.1:13002,10.254.1.1:13002,10.254.1.1:13002 
--verbose=true --outputformat=csv -e 
"select * from lqioc_ioc_ods.wghhjrkxx limit 100000">wghhjrkxx.csv

亲测语句2：

spark-beeline -u jdbc:hive2://10.254.1.1:13002,10.254.1.1:13002,10.254.1.1:13002 
--verbose=true --outputformat=csv -e 
"select concat_ws(',',zym,xh,xm,sswg,xb,csrq,sfzhm,hhf,yhzgxf,hjd,hjmlxz,
xzd,xzmlxz,wzsyy,fwcs,lxdh,lxsj,
mz,zzmm,xl,zylb,zy,hyzk,zjxy,jg,rhyzbs,wcyy,wcsj,wcqx,wcxz,createtime,
updatetime,seq,updatestatus,sys_key) 
as onecl from lqioc_ioc_ods.wghhjrkxx limit 100000">wghhjrkxx.csv

iconv -f UTF-8 -c -t GBK wghhjrkxx.csv > wghhjrkxx2.csv

例如：

beeline -u $url --silent=true --showHeader=false --outputformat=csv --color=true -e "$hql"

格式参数:--outputformat=[table/vertical/csv/tsv/dsv/csv2/tsv2]

hive表中的数据使用hive - e"select * from table">aa.csv导出到csv文件的时候在window中用Excel打开查看的时候是乱码，而且格式也不对。

原因有下面两个：

1.乱码的原因是用excel打开csv时格式默认为gbk，但是从hive中导出来的是utf8的

2.格式不对的原因是csv文件的列分隔符是逗号或者\t，而hive中默认使用\001

解决办法：

使用hive中的concat_ws函数将所有列连接起来组成一列。

concat_ws('分隔符',列1,列2,……)，语句如下

hive -e " select concat_ws(',',cat1,cat2,dd_name) as onecl from dd_prod">testaa.csv

然后再使用iconv -f UTF-8 -c -t GBK testaa.csv > testbb.csv转换编码。得到的testbb.csv没有乱码格式也对。

原文：https://blog.csdn.net/lgdlxc/article/details/42126225

猜你喜欢

转载自blog.csdn.net/SunWuKong_Hadoop/article/details/87284904

spark-beeline导出hive表数据到csv方法，乱码原因及解决方案

spark-beeline --help

db2查询结果导出csv文件，以及用Excel打开csv数据类型原因显示乱码或数据后几位变0的解决方案

plsql developer导出csv文化乱码解决方案

Spark读取文本或CSV文件中文乱码的解决方案

hive beeline到数据

hive 导出数据到 csv

hive表数据更新的一种解决方案（使用spark进行）

csv/txt文件导入数据库中数据表中中文乱码问题解决方案

Kettle spoon中mysql数据导入hive从建表到导数据解决方案参考

Hive导出数据到本地CSV

hive 导出数据到本地CSV

使用Spark 编码写入 hive 的过程中 hive字段乱码 [解决方案]

CSV文件打开乱码解决方案

spark结合hive数据倾斜的几种解决方案

navicat导出longtext类型数据乱码的解决方案

hive使用beeline将hql结果导出为csv文件

beeline-导出csv

Hive导入CSV数据解决乱码

浅谈乱码原因及解决方案

Hive中文注释乱码解决方案

PHP导出大量数据到csv表

Mysql 导出表数据到 csv

beeline 连接SPARK /Hive

Spark 从 hbase 中导出表信息到本地csv格式

hive导出数据到本地文件报错解决方法

从Hive表中导出数据到文件

ArcGIS导出Shp文件导入到南方Cass出现乱码的解决方案

python写入csv文件中文乱码解决方案

csv文件用excel打开乱码的解决方案

今日推荐

周排行

rac环境打PSU补丁ERROR:This patch is not applicable to GI home.

科学活动《离园倒计时》（时间）

Windows 沙箱开发踩坑

secureCRT 改变显示宽度

hdu多校第六场1008 （hdu6641）TDL 暴力

【low向】注册用户时密码强度的判定

__int64

context-params与init-params

JS三个编码函数和net编码System.Web.HttpUtility.UrlEncode比较

springboot通过重写addResourceHandlers拦截请求访问本地资源

每日归档

更多

2024-08-08(0)

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)