本系列是本人对Hive的学习进行一个整理,主要包括以下内容:
1.HiveQL学习笔记(一):Hive安装及Hadoop,Hive原理简介
2.HiveQL学习笔记(二):Hive基础语法与常用函数
3.HiveQL学习笔记(三):Hive表连接
4.HiveQL学习笔记(四):Hive窗口函数
5.HiveQL学习笔记(五):Hive练习题
接下来对第四个内容进行介绍。
窗口函数
1.累计计算窗口函数
1.sum(…)over(…)
1. partition by:分组的作用
2. order by:按照什么顺序进行累加(使用order by 时,数据的范围是一点一点增加的,因此能起到累加的作用)
2.avg(…)over(…)
移动平均:
3.语法总结
2.分区排序窗口函数
1.row_number()、rank()、dense_rank()over(…)
三者区别:
3.分组排序窗口函数
1.ntile(n)over(…)
对数据进行切分,可实现取前百分之多少的数据。
4.偏移分析窗口函数
1.lag(…)、lead(…)over(…)
lag:滞后,取的是以前的数据,在该数据之前的数据。
lead:带领,取的是以后的数据,在该数据之后的数据。
使用例子: