文章目录
一、大数据概念
大数据就是巨量的数据。大数据的计量单位已经超过TB级别发展到PB、EB、ZB、YB甚至BB级别。
大数据是指在一定时间内无法使用传统数据库软件工具采集、存储、管理和分析其内容的数据集合。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对于这些含有意义的数据进行专业化处理。
二、大数据5大特点
大数据具有5各方面的特点,规模性(Volume)、多样性(Variety)、高速性(Velocity)、价值性(Value)、真实性(Veracity)。
2.1 规模性
数据规模大
2.2 多样性
大数据可以分为三类:
1.结构化数据,指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每行数据的属性是相同的。
2.非结构化数据,指的是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二位逻辑表来表现得数据。
3.半结构化数据,是结构化数据的一种,不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要。
结构化数据占比比较大,但是产生价值的往往是这些非结构哈u数据。
2.3 高速性
数据的增长速度和处理速度是大数据高速性的重要体现。
海量数据的背后带来的是更大的挑战,即如何快速计算分析大数据成为当下热门的话题。
2.4 价值性
大数据的核心特征是价值。价值密度的高低和数据总量的大小是成反比的,即数据价值密度越高数据总量越小,数据价值密度越低数据总量越大。
2.5 真实性
真实性就是数据的质量。
三、大数据应用场景
3.1 电商大数据
精准营销法宝
3.2 金融大数据
大数据在金融行业的应用可以总结一下五个方面:精准营销、风险管控、决策支持、效率提升以及产品设计。
3.3 医疗大数据
3.4 零售大数据
了解客户消费喜好和趋势,进行商品的精准营销,降低营销成本。依据客户购买产品,为客户提供可能购买的其他产品,扩大销售额,也属于精准营销范畴。
3.5 交通大数据
3.6 舆情监控大数据
四、业务流程分析
1.产品人员提需求:统计总用户数、日活跃用户数、回流用户数等
2.数据部门搭建数据平台、分析数据指标
3.数据可视化(报表展示、邮件发送、Echarts)