大数据-笔经(数据清洗)

谈谈你对ETL过程中数据清洗的认识
参考答案:
数据清洗包括以下内容:

1.数据补缺:对空数据、缺失数据进行数据补缺操作,无法处理的做标记。

2.数据替换:对无效数据进行数据的替换。

3.格式规范化:将源数据抽取的数据格式转换成为便于进入仓库处理的目标数据格式。

4.主外键约束:通过建立主外键约束,对非法数据进行数据替换或导出到错误文件重新处理。

猜你喜欢

转载自blog.csdn.net/weixin_41227335/article/details/88364948