Impala
Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。
已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。
相比之下,Impala的最大特点也是最大卖点就是它的快速。
Hive
ods层,
dwd层:明细数据层。
dws层:汇总数据层。
app层:应用层。
同步工具:。
bi层:业务层。
Impala
Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。
已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。
相比之下,Impala的最大特点也是最大卖点就是它的快速。
Hive
ods层,
dwd层:明细数据层。
dws层:汇总数据层。
app层:应用层。
同步工具:。
bi层:业务层。