数仓的数据存储在hdfs中,业务数据和可视化数据存储在mysql中,日志数据存储在file中。
flume和kafka用于把日志数据file导入到hdfs中,sqoop用于把业务数据mysql的数据导入到hdfs中