在hive中,数据的存储是按照列的形式存储的。
hive中的列分为列族和列的限定符。
在hive中,列族必须作为表的模式预先给出。列名可以以列族作为前缀,每个列族可以有多个成员。新的成员可以随后按照需要动态加入。
HBASE中的单元格:
HBASE中的单元格是由行,列族,列的限定符,值和代表值版本的时间戳组成的。cell中的数据是没有类型的,全部是按照字节码的形式存储的。
时间戳:
HBASE中的时间戳是为了区分版本号的,写在时间的后边的。
不同的版本号按照时间进行排序,是以倒序的形式进行排序的。最新的时间的数据会排在最前边的。