自动拼接sql的原理

概述

标准的数仓设计(至少要有事实表、维度实体、维表),topic层其实就是雪花型宽表(单事实表上关联多个维表),app层其实就是星座型宽表(多个雪花型宽表union all),标准的app逻辑,应该是多个topic层union all,left join操作只存在于事实表和维表之间。

具体思路

基于标准的数仓,人工写sql,其实就是对物理事实表在逻辑上进行扩展,主要逻辑可以总结为以下两种

  • 【维度扩展】我们基于雪花模型,根据事实表、维度实体、维表之间的绑定关系,对事实表进行了逻辑上的展开。
    举例来说,下图中,【事实表】绑定了【商家维度实体】,而【商家维度实体】又绑定了【商家维表】,【商家维表】又可以扩展出【商家蜂窝维表】,通过多次left join,可以将【商家维表】及其扩展出维表中的所有维度纳入至逻辑宽表中。
  • 【指标扩展】通过原始指标+维度维值的计算方式,可以扩展出派生指标;通过四则计算可以扩展出计算指标。

在这里插入图片描述

经过这两种方式的扩展,我们就得到了一张雪花模型逻辑宽表。
在这里插入图片描述

在完成雪花模型逻辑宽表的构建过后,我们在一致性维度的基础上进行跨雪花模型宽表的计算指标的扩展。进而得到星座模型逻辑宽表。

在这里插入图片描述

经过以上述的扩展,我们就得到了雪花模型逻辑宽表,星座模型逻辑宽表两种逻辑宽表模型,下文统称为逻辑宽表。

猜你喜欢

转载自blog.csdn.net/u011624157/article/details/129137472