从CSV文件导入Hive出现中文乱码问题解决 - 代码天地

从CSV文件导入Hive出现中文乱码问题解决

企业开发 2023-06-11 20:23:41 阅读次数: 0

1、问题描述

关于HIVE中文乱码问题的解决办法，网上有很多帖子，然而很多都是基于LINUX终端显示字符的修改，其实上对于一些条件下的HIVE中文乱码问题是无法解决的，如从CSV文件导入到HIVE中出现的中文乱码问题。

HIVE原生的字符编码是采用UTF-8方式的，这是支持中文的。然而在从ORACLE导出CSV文件，注入到HIVE表中的时候，就发现输入时出现中文乱码。按照HIVE中文乱码的解决思路总是没有成功。

后来考虑到HIVE将数据是存放在HDFS上的，并以序列化的方式存在，因此应该考虑HDFS中文乱码的问题，这一查，资料还不少。也看到了核心的问题所在： hadoop涉及输出文本的默认输出编码统一用没有BOM的UTF-8的形式，但是对于中文的输出window系统默认的是GBK，有些格式文件例如CSV格式的文件用excel打开输出编码为没有BOM的UTF-8文件时，输出的结果为乱码，只能由UE或者记事本打开才能正常显示。因此将hadoop默认输出编码更改为GBK成为非常常见的需求。

2、解决问题

设置序列化编码为GBK，以WINDOW拷贝导入的数据编码相匹配。

hive> ALTER TABLE tablename SET SERDEPROPERTIES ('serialization.encoding'='GBK');

再次导入hdfs上的csv文件

发现这样就不会出现乱码的情况

猜你喜欢

转载自blog.csdn.net/qq_56520755/article/details/128467910

从CSV文件导入Hive出现中文乱码问题解决

hive导入csv出现中文乱码问题

Python - 中文写入csv 文件出现乱码问题解决

navicat导入txt文件中文乱码问题解决

plsql导入sql文件中文乱码问题解决

csv/txt文件导入数据库中数据表中中文乱码问题解决方案

Python问题解决-Excel打开CSV格式内容时中文出现了乱码

python csv 格式文件导出中文乱码问题解决方法

【转】python csv 格式文件中文乱码问题解决方法

Jmeter保存csv数据文件出现乱码问题解决

MySQL导入CSV文件时，出现中文乱码的问题及解决方法

解决Navicat for Oracle(MySQL)导入csv文件时出现中文乱码的问题

Outlook2019邮件客户端导入CSV通讯录中文乱码问题解决办法

eclipse导入工程中文注释乱码问题解决

【MSSQL】SQL SERVER导入中文乱码问题解决

解决NavicatPremium导入CSV文件中文乱码的问题

Navicat：解决导入csv文件中文乱码的问题

javac命令编译java文件成class文件出现中文乱码问题解决

Oracle导入sql文件数据，中文乱码问题解决方案

【其他】【navicat】【1】navicat导入txt文件中文乱码问题解决

Oracle在PL/sql 中导入运行sql文件，数据出现乱码，问题解决

threejs使用TextGeometry中文出现乱码问题解决

Java读取properties文件，中文出现乱码问题解决

Hive 导入的中文数据出现乱码问题

python zip 文件解压中文乱码问题解决

Java读取properties文件中文乱码问题解决

文件下载中文乱码问题解决方案

QT打开文件，中文乱码问题解决

ECLIPSE 关于.properties文件中文乱码问题解决

ExcellentExport.js导出csv中文乱码问题解决方法

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)