目录
以下表为例:
列式存储
采用列式存储时,数据在磁盘上的组织结构为:
可以看到每个字段的值都是按顺序扎堆存储在一起的,
好处:如果想查所有人的年龄只需把年龄那一列拿出来就可以了,例如 select age from xxx
行式存储
采用行式存储时,数据在磁盘上的组织结构为:
好处:想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。
列式存储的好处
- 对于列的聚合,计数,求和等统计操作原因优于行式存储。
- 由于某一列的数据类型都是相同的,针对于数据存储更容易进行数据压缩,每一列选择更优的数据压缩算法,大大提高了数据的压缩比重。
- 由于数据压缩比更好,一方面节省了磁盘空间,另一方面对于 cache 也有了更大的发挥空间。