最近一周没有出新的博文,主要是在困惑中。对于数据分析,到底该怎么做?
2020年的时候,自己看过不下于20本python相关的书籍,主要是偏向于技方面。那对于数据分析,重要的主要可以概括为两方面:技和术。
突然想起一句不太适用这个场景的一句话:
懂得那么多大道理,却依然过不好这一生。
那迁移到数据分析这里呢,自己会了一些“技”,却依然做不好“数分”这个活。最近拿到了一批公司产品的数据,这周主要就是在和这批数据打交道,其实用到的“技”挺基础的,无非就是:
- 数据库表的关联连接
- 数据的分组统计
- 指标的描述性统计
- 指标的来源、归属统计
因为就是对现有数据的一个情况摸底,换言之,就是对现状分析。因此,对于现状分析,涉及到的主要方面无非就是数据的来源、构成等基本属性的分解和统计。用到的技呢,也是很基础的技能。简单放一张结果图吧。
今年来,自己感觉自己以前太过于着急,迷恋于所谓高级的“技”,而忽略了基础的“技”,因此,也在开始将一些基础知识在做一个归纳和整理。做好数据分析,绝大部分的场景,用到的“技”并非自己所追求的高大上的技术,而是对于实际情况的拆解和归因,若能再寻得解决之道,那就是更上一层楼。
记得在《数据思维》那本书中,还提到过“分析之术”,也是时候再品读下,这关键之术。这个时代,要求我们具备的技能越来越多,技能面也越来越来越广,很常见的一个说法,叫什么“人人都是分析师”,其实,细细想来,好像也没什么错。遇到一件事,我们都会有一个思考的过程,那这个过程其实也可以概论之为“分析”。回到数据分析本身,那其实就是用定量之道,解现实之惑。那这“道”,借用《成为数据分析师》那本书所言,就是三阶段6步骤:
- 第一阶段: 构建问题
1.识别问题
2.回顾之前的发现- 第二阶段:解决问题
3.建模或选择变量
4.收集数据
5.分析数据- 第三阶段:传达结果并基于结果采取行动
6.传达结果并采取行动
这条路,漫长但也很有趣,期待去探索,去发现,去寻找光明。