1. 什么是大数据?
字面意思理解:大量的数据,海量的数据
数据集的大小已经远远超过了现有普通数据库软件和工具的处理能力的数据
2. 大数据有什么特点?
1.海量化
数据量大(多)
2.多样化
结构化数据,半结构化数据,和非结构化数据
3.快速化
数据的增长速度快
4.高价值
海量数据价值高
3. 大数据能做什么?
1.海量数据快速查询
2.海量数据的存储(数据量大,单个大文件)
3.海量数据的快速计算(与传统的工具对比)
4.海量数据实时计算(立刻马上)
5.数据挖掘(挖掘以前没有发现的有价值的数据)
4. 大数据项目流程
1.数据的生产 --> 2.数据采集 --> 3.数据存储 --> 4.需求分析 --> 5.数据预处理
--> 6.数据计算 --> 7.结果数据存储 --> 8.结果数据展现