hive分隔符\001和\011与\x03 用pandas切割时出现的问题 - 代码天地

hive分隔符\001和\011与\x03 用pandas切割时出现的问题

其他 2019-05-12 03:10:55 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/datadev_sh/article/details/84583157

hive导出数据，想找一个分隔符。hive默认分隔符是“\001”。想换个其他的。在ASCII码对照表中找了下，决定用“\0011”。
在这里插入图片描述
然后Hive能正常导出数据，到notepad++里面显示的字符和ASCII码对照表里的是一样的。

但是在pandas中用“\011”切割时，切割不出，且字段首尾不能有空格。

# Python
data = pd.read_table(path,header=None, sep='\011')

# scala
val actionRDD = data.map(_.split("\\011"))

用“EmEditor”打开这个文件，这个字符被显示为“\x03”。
在这里插入图片描述

所以在pandas中用“\x03”能成功切割。

data = pd.read_table(path,header=None, sep='\x03')

猜你喜欢

转载自blog.csdn.net/datadev_sh/article/details/84583157

hive分隔符\001和\011与\x03 用pandas切割时出现的问题

【Pandas】Pandas分组：结合切割和应用

Hive创建表时的分隔符

刀切水果（平面和空间切割问题）

python字符串高级（切割多个分隔符）

linux下操作文件以分隔符切割并去重

hive默认分隔符引起的日志分割问题

解决MySQL多行模式问题和分隔符问题

windows和linux的路径分隔符问题

hive用正则表达式的方式使用多字节切割符号

Hive的列分隔符和行分隔符

PHP统计字符串长度和切割字符串函数（解决乱码问题，和切割中文问题）

怎么用AD17在PCB上切割特殊的板子大小和板子边框

hive表中使用testfile格式保存时，常用的字段分隔符

nginx和tomcat日志切割

JAVA文件切割和复原

日志配置和及切割

图形的变换、组合和切割

C# List<string>和ArrayList用指定的分隔符分隔成字符串

sqoop从mysql到hive导入时分隔符问题

如何解决使用hive将多字符作为分隔符的数据入库的问题

传引用和传值的区别和对象切割问题（二）

Hive分隔符

使用映射从Oracle往hive导数，数据条数增加问题--字段包含换行和换行分隔符导致条数增加

html5关于js中转换的问题和字符串切割

Makefile 出现：遗漏分隔符

记用split通过";"切割字符串，存入数组出现的小问题

OpenCV之圆形切割和矩形切割的实现

opencv利用投影法进行水平切割和垂直切割

nginx日志切割，logrotate和nginx日志切割

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)