数据清洗：去掉txt文件中有空缺值的行 - 代码天地

数据清洗：去掉txt文件中有空缺值的行

其他 2020-04-19 11:04:02 阅读次数: 0

最近在做爬虫爬取豆瓣读书的数据，发现很多书籍会没有评分，当时爬虫也没做特别处理，所以这个问题保留了下来。
数据格式就是以英文逗号分隔，（book_id,book_name,book_score）
一部分数据如下

1443021,网络营销, 
2265243,How Buildings Work, 
4022720,影子富豪查克·菲尼, 7.3 
2157526,Mind Set!, 
1431351,平家物语图典, 7.1

之前试过了判断是不是None，或者用正则匹配Null都不行
最后想到的办法就是将score转换成字符串，因为此时的score是列表list的一个元素，之后只需将字符串score与" "判断是否相同即可
代码如下：

#处理缺失值的程序   auther:wuyou
file = open("BookInfo.txt","r",encoding="utf-8")  #打开老文件,读模式
newfile = open("Book.txt","a",encoding="utf-8")   #打开新文件，追加写模式
for line in file:
    info = line.replace("\n","")    #去掉换行符
    book_info = info.split(",")     #划分数组
    if len(book_info) > 3:          #如果多于3个元素
        continue
    score = str(book_info[2])       #转换成字符串
    if score == " ":                #如果字符串为空
        continue
    newfile.write(line)             #如果通过前两项测试，则写入新的文件中保存
file.close()        #关闭文件
newfile.close()     #关闭文件

江西师范大学-20届-吴悠

发布了304 篇原创文章 · 获赞 51 · 访问量 14万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_39905917/article/details/104857763

数据清洗：去掉txt文件中有空缺值的行

python删除csv文件中有空值的行

pandas删除指定列中有空值的行

python爬虫--xpath方式清洗数据，class内容中有空格，清洗失败怎么办？

python删除csv文件中有缺失值的行

当一行输入中有空格时

【数据挖掘】数据清洗——空缺值全局替换代码实现

pandas删除含有空值的行

在做导入一个excel文件的时候,数据有空值的时候

一行代码快速去掉字符串中的所有空格

C#中调用cmd，传值路径中有空格报错的处理方法

scp遇到路径中有空格

查询数据库中有没有空表

IndexError: list index out of range - 报错原因分析（文件中有空行）

linux命令行下文件名中有空格的处理方法

oracle数据库计算表中有一行数据的某个值为空时的问题

如何判断numpy中的nan值（pandas怎么筛选某列有空值的行）

Matlab 读取txt文件指定行的数据

QString去掉所有空格

JS(去掉前后空格或去掉所有空格)的用法

批处理快速删除txt大文件所有空行的小工具

js读取txt文件并替换所有空格为换行

Python读取有空行的txt文件+将内容分割保存到列表中

关于Sql数据库中去掉字段的所有空格

Python-pandas.DataFrame-找出有空值的行

vscode去掉txt里的空白行

python操作txt文件中数据教程[4]-python去掉txt文件行尾换行

python保存csv文件内容每隔一行就有空行的问题

oracle 字段名中有空格的查询

RestTemplate传输值为null的属性、利用FastJson将属性中有空值null的对象转化成Json字符串

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)