【xls转成csv】常规方法进行xls到csv转换(nsupported format, or corrupt file: Expected BOF record; found b‘\xe8\xae)

数据中导出的excel文件:原xls文件的格式

GB2312(简体中文)

导成的数据格式:

UTF-8编码

因为python中读取xls总是出现如下错误:

nsupported format, or corrupt file: Expected BOF record; found b'\xe8\xae

试了很多网上的方法但是一直出现问题,所以尝试一种新的传统方法来解决。
使用windows软件:Notepad++,打开excel文件发现数据之间的使用空格隔开的。如下所示:
在这里插入图片描述
但是CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。

第一步:
我们使用常规方法,在Notepad++中打开的excel文件,使用全局替换将‘空格’使用‘,’替换,完成后的文件样式如下图。
在这里插入图片描述
第二步:
设置文件编码格式,点击菜单栏
编码->转为UTF-8编码**,然后文件另存为csv文件,即可。
我们在python中输入读取文件代码:

import pandas as pd
data = pd.read_csv('F:\\CodeDocument\\jupyter\\Test\\Bdddd.xls.csv')
data

在这里插入图片描述
可以看到能够正常读取文件了,虽然方法比较麻烦但是确实可以使用的。

猜你喜欢

转载自blog.csdn.net/weixin_41990278/article/details/108380579