数据清洗笔记 - 代码天地

数据清洗笔记

其他 2018-09-18 03:56:34 阅读次数: 0

工作上接触到的数据特别脏

主要体现：

1.OCR识别精度

2.人工乱给label，同一个数据能给三种不同的label

主要清洗方法：

1.模型特定的预测概率表示完全匹配（如：0.82828）

2.所有特征值>0.99，给全分；所有特征值<0.01，给0分

3.人工筛选

希望能找到更加适合的方式

清理工具（还没有测试）：

OpenRefine: regular expressions, GREL

猜你喜欢

转载自blog.csdn.net/henghen9943/article/details/81164144

数据清洗笔记

9.9学习笔记（数据清洗）

python数据清洗学习笔记--数据转换

PySpark学习笔记（7）——数据清洗

Python学习（笔记4-数据清洗）

目标检测——数据清洗的学习笔记

python数据清洗学习笔记--文件读写

Python数据清洗学习笔记--概述

9.19学习笔记（数据清洗、建模）

实用机器学习笔记（四）：数据清洗

数据清洗

清洗数据

【Python数据分析学习笔记-7】数据清洗与整理-数据清洗

学习笔记(36):Python数据清洗实战-Numpy常用数据清洗函数

学习笔记(15):Python数据清洗实战-Numpy常用数据清洗函数

学习笔记(03):Python数据清洗实战-Numpy常用数据清洗函数

学习笔记(05):Python数据清洗实战-数据整理

学习笔记(20):Python数据清洗实战-数据筛选

学习笔记(35):Python数据清洗实战-数据离散化

学习笔记(23):Python数据清洗实战-数据整理

学习笔记(09):Python数据清洗实战-数据筛选

python数据清洗学习笔记--数据统计

python数据清洗学习笔记--数据表处理

R语言笔记——回顾小结（数据清洗，建模简单流程）

python学习笔记4_数据清洗与准备

学习笔记(07):Python数据清洗实战-重复值处理

学习笔记(40):Python数据清洗实战-Excel文件读写

学习笔记(39):Python数据清洗实战-csv文件读写

学习笔记(36):Python数据清洗实战-课程总结

学习笔记(34):Python数据清洗实战-异常值处理

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)