大数据学习之路35-hive的join - 代码天地

大数据学习之路35-hive的join

其他 2018-08-31 05:51:43 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_37050372/article/details/81901856

select

join

inner join

left join  == left outer join

right join == right outer join

full outer join

我们先来创建数据和表：

内连接（内连接的本质其实是取笛卡尔集）：

select a.*,b.* from t_a a join t_b b on a.id = b.id;

左外连接：

select a.*,b.* from t_a a left join t_b b on a.id = b.id;

右外连接：

select a.*,b.* from t_a a right join t_b b on a.id = b.id;

全外连接：

select a.*,b.* from t_a a full join t_b b on a.id = b.id;

半连接：

我们先来对比一下：

select a.* from t_a a  join t_b b on a.id = b.id

这里是查出左边的一半：

select a.* from t_a a left  semi join t_b b on a.id = b.id;

我们可以看到上面使用内连接查询左边的一半用了6.639秒，而使用半连接用时5.133秒效率明显提高了。

所以如果我们只想查询一半的数据可以使用semi半连接来提高mapreduce的效率。

这是为什么呢？因为如果我们使用内连接来查询一半的话，它会把两张表的数据都发送到reduce端做聚合，而使用semi半连接，则不会发送所有的数据。

不等值查询：

select a.*,b.* from t_a a  join t_b b on a.id > b.id;

select a.*,b.* from t_a a , t_b b where a.id > b.id;

在老版本中，不支持非等值的join

在1.2.1后都支持非等值join,不过写法应该如下：

select a.*,b.* from t_a a , t_b b where a.id > b.id;

不支持的语法：

select a.*,b.* from t_a a join t_b b on a.id > b.id;

猜你喜欢

转载自blog.csdn.net/qq_37050372/article/details/81901856

大数据学习之路35-hive的join

大数据学习笔记35：Hive - 内部表与外部表

大数据学习之路21-MR编程，join算法

大数据学习之路92-sparkSQL整合hive

【大数据】Hive Join 的原理与机制

大数据学习之路

大数据开发之路：hive篇

Hive学习之路（十九）Hive的数据倾斜

大数据学习之路36-hive的自定义函数示例，复杂数据解析

[Hadoop大数据]——Hive连接JOIN用例详解

大数据学习之hive

大数据学习——hive使用

大数据学习——hive函数

Hadoop大数据学习---HIVE

大数据学习——mapreduce案例join算法

大数据学习之路-简介

大数据学习之路-hdfs

大数据学习之路-phoenix

大数据学习之路--HDFS

大数据学习之路55-sqoop安装及从mysql导入数据到hdfs，导入数据到hive示例

大数据学习系列——HIVE学习分区

大数据学习——hive数据类型

大数据学习：hive篇，入门学习大数据开发

java程序员的大数据之路（16）：Hive简介

大数据开发之路：hive篇，你看了吗？

大数据学习之Hive的安装

【大数据学习】之Hive初认识

大数据学习——hive安装部署

9.大数据学习之旅——hive

大数据学习——hive基本操作

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)