大数据之Hive简介 - 代码天地

大数据之Hive简介

其他 2021-11-25 06:02:58 阅读次数: 0

Hive基本概念

1.1什么是Hive

1）hive简介

Hive:由facebook开源用于解决海量结构化日志的数据统计工具。

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

2）Hive本质：将HQL转化成MapReduce程序

（1）Hive处理的数据存储在HDFS

（2）Hive分析数据底层的实现是MapReduce

（3）执行程序运行在Yarn上

1.2Hive的优缺点

1.2.1优点

（1）操作接口采用类SQL语法，提供快速开发的能力（简单，容易上手）。

（2）避免了去写MapReduce,减少开发人员的学习成本。

（3）Hive优秀在于处理大数据，支持海量数据的分析与计算。

（4）Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数。

1.2.2缺点

1）Hive的HQL表达能力有限

（1）Hive自动生成的MapReduce作业，通常情况下不够智能化。

（2）数据挖掘方面不擅长，由于MapReduce数据处理流程的限制，效率更高的算法却无法实现。

2）Hive的效率比较低

（1）Hive的执行延迟比较高，因此Hive常用于数据分析，对实时性要求不高的场合。

（2）Hive调优比较困难，粒度较粗。

3）Hive不支持实时查询和行级别更新

（1）hive分析的数据是存储在hdfs上，hdfs不支持随机写，只支持追加写，所以在hive中不能updata和delete，能select和insert.

猜你喜欢

转载自blog.csdn.net/qq_38800259/article/details/108119214

大数据之Hive简介

大数据仓库hive初识简介

大数据 | Hadoop Hive Spark简介

大数据组件——Hive简介及入门

大数据Hive系列之Hive API

大数据Hive系列之Hive MapReduce

大数据技术之Hive(Hive搭建)

大数据之hive与impala

大数据学习之hive

大数据技术之Hive

大数据系列之数据仓库Hive知识整理（一）Hive简介，架构与工作流程，环境搭建

大数据技术之Hive(Hive数据类型)

大数据技术之Hive(Hive命令---DDL数据定义)

大数据之hive:Hive数据类型

【大数据】Hive系列之- Hive-DDL 数据定义

【大数据】Hive系列之- Hive-DML 数据操作

大数据平台运维之Hive

大数据学习之Hive的安装

【大数据学习】之Hive初认识

大数据技术之Hive(一

大数据BigData之hive与RMDBS的对比

大数据BigData之Hive的结构

走近大数据之Hive进阶（目录）

走近大数据之Hive入门（目录）

大数据之四：Hive安装

大数据学习之Hive框架整理

【大数据系列】之Hive DDL and DML

大数据面试系列之——Hive

大数据软件安装之Hive（查询）

大数据技术之Hive（4）

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)