维度建模简介

凡事应该尽量简单,直到不能再简单为止。想明白、完全理解以下概念是做数仓工程师的必备条件之一。

一、用于度量的事实表

1.应该尽量将来源于同一个业务过程的底层度量结果存储于一个维度模型中。

2.事实表中的每一行对应一个度量事件。每行中的数据是一个特定级别的细节数据,称为粒度。

  物理世界的每一个度量事件与对应的事实表行具有一对一的关系,这一思想是维度建模的基本原则。

3.事实表包含多个外键,外键集合成主键,所以事实表的主键常称为组合键。

二、用于环境描述的维度表

1.数据仓库的好坏直接取决于维度属性的设置。

2.每个维度表由单一主键定义,用于在与事实表连接操作时作为参照完整性的基础。

3.维度表通常以层次关系表示。

4.关注维度表的简单性和可访问性,不需要满足第三范式,也尽量减少雪花模式。

三、维度表与事实表的连接

1.每个业务过程包含事实表,围绕事实表的是多个维度表,采用星形连接。

2.粒度最小的数据或原子数据具有最多的维度。

猜你喜欢

转载自www.cnblogs.com/shimingjie/p/11919177.html