Hive（jdbc/odbc的java实现）基于hadoop的数仓管理工具 - 代码天地

Hive（jdbc/odbc的java实现）基于hadoop的数仓管理工具

企业开发 2023-08-22 17:45:03 阅读次数: 0

Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼，查询和分析。可以将结构化的数据文件映射为一张数据库表，可以将简单的SQL语句转换为MapReduce任务进行运行。学习成本低，可以快速实现简单的MapReduce统计，十分适合数据仓库的统计分析。

架构

基本组成:

用户接口：包括CLI、JDBC/ODBC、WebGUI。其中，CLI(command line interface)为shell命令行；JDBC/ODBC是Hive的JAVA实现，与传统数据库JDBC类似；WebGUI是通过浏览器访问Hive。
元数据存储：通常是存储在关系数据库如mysql/derby中。Hive 将元数据存储在数据库中。Hive 中的元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等。
解释器、编译器、优化器、执行器:完成HQL 查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS 中，并在随后有MapReduce 调用执行。
Hive 支持的前四种文件格式是纯文本、序列文件、优化行列 (ORC) 格式和 RCFile

猜你喜欢

转载自blog.csdn.net/weixin_29403917/article/details/128113453

Hive（jdbc/odbc的java实现）基于hadoop的数仓管理工具

基于Java的Git在线管理工具：Gitblit

Hive--可执行SQL的Hadoop数据仓库管理工具

基于flutter的密码管理工具

SpringBoot实现的Mongodb管理工具

JAVA 监控管理工具

java项目管理工具收集

Java包管理工具-maven

java项目管理工具Maven

Java 项目管理工具 - Maven

管理工具

数仓工具—Hive进阶之权限管理(7)

Mongodb网页管理工具,基于Spring Boot2.0，前端采用layerUI实现

实现基于网络的yum源和包管理工具

java包管理工具之maven包管理工具

基于eclipse RCP的文件夹管理工具

phpMyAdmin 4.9.1 发布，基于 Web 的 MySQL 管理工具

dolt 基于git协议的数据管理工具

基于Github gist的代码片段管理工具Lepton

【管理工具】进程管理工具Supervisor

hadoop基础----hadoop实战(十四)-----hadoop管理工具---CDH移除主机

研发管理工具

docker管理工具

项目管理工具

进程管理工具

代码管理工具

hbase 管理工具

Docker 管理工具

【Zookeeper管理工具】

依赖管理工具

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)