高级分组函数（rollup、cube、grouping sets）

#1、使用场景

ROLLUP，CUBE，GROUPING SETS 函数可以理解为Group By 分组函数封装后的精简用法，相当于多个union all 的组合显示效果，但是要比多个 union all 的效率要高。

##1.1 测试数据

CREATE TABLE emp (
   ID            NUMBER PRIMARY KEY,
   NAME          NVARCHAR2(30),
   sex           VARCHAR2(10),
   birthday      DATE,
   work_location VARCHAR2(30),
   sal           NUMBER(10)
);
COMMENT ON TABLE  emp               IS '员工信息表';
COMMENT ON COLUMN emp.id            IS '员工id';
COMMENT ON COLUMN emp.name          IS '员工姓名';
COMMENT ON COLUMN emp.sex           IS '性别';
COMMENT ON COLUMN emp.birthday      IS '出生日期';
COMMENT ON COLUMN emp.work_location IS '工作地点';
COMMENT ON COLUMN emp.sal           IS '工资';

INSERT INTO emp(ID, NAME, sex, birthday, work_location, sal)
VALUES(1, '小王','男', to_date('1994-12-08','yyyy-mm-dd'), '杭州', 4500);
INSERT INTO emp(ID, NAME, sex, birthday, work_location, sal)
VALUES(2, '小瑞','男', to_date('1995-02-01','yyyy-mm-dd'), '杭州', 8000);
INSERT INTO emp(ID, NAME, sex, birthday, work_location, sal)
VALUES(3, '小倩子','女', to_date('1994-07-08','yyyy-mm-dd'), '上海', 6000);
INSERT INTO emp(ID, NAME, sex, birthday, work_location, sal)
VALUES(4, '小权','男', to_date('1993-01-01','yyyy-mm-dd'), '北京', 8000);
INSERT INTO emp(ID, NAME, sex, birthday, work_location, sal)
VALUES(5, '小优子','男', to_date('1994-12-08','yyyy-mm-dd'), '深圳', 9000);
INSERT INTO emp(ID, NAME, sex, birthday, work_location, sal)
VALUES(6, '小游子','女', to_date('1994-07-08','yyyy-mm-dd'), '深圳', 7500);

#2、知识点小结
##2.1 group by

只能 select 聚合函数（如：sum() 、max()、min()、avg()、count()）
筛选只能 having，不能是 where
不能对 clob 类型项目进行 group by

如：以下语句就会报错
WITH t_1 AS (
   SELECT to_clob(t.name) a
     FROM emp t
)
SELECT COUNT(1)
  FROM t_1 
 GROUP BY a;

##2.2 grouping sets

group by (A, B) 是对 A，B 共同进行分组
group by grouping sets(A, B) 是对 A，B 单独进行分组

这里写图片描述

##2.3 rollup（累计累加）

按列从右递减分组
先小计后合计
自动排序 order by(1, 2, 3, …, n)
若有 N 列，则 group by N+1 次

如： group by rollup(A, B, C)，首先对（A，B，C）进行 group by，然后对（A，B）进行 group by，然后对（A）进行 group by，最后对全表进行 group by

SELECT A, B, C, SUM（D） FROM table_name GROUP BY ROLLUP(A, B, C)；
等同于
SELECT * from (
SELECT A, B, C, SUM（D） FROM table_name GROUP BY（A, B, C）
UNION ALL
SELECT A, B, null, SUM（D） FROM table_name GROUP BY(A, B, null)
UNION ALL
SELECT A, null, null, SUM（D） FROM table_name GROUP BY (A, null, null)
UNION ALL
SELECT null, null, null, SUM（D） From table_name group by (null, null, null)
) order by 1, 2, 3

这里写图片描述

##2.4 cube(交叉列表)

交叉组合，与顺序无关（rollup 则与顺序有关）
若有 N 列，则 group by 2^N 次

它比 rollup 扩展更加精细，组合类型更多，对于 cube 来说，列的名字只要一样，那么顺序无所谓，结果都是一样的，因为 cube 是各种可能情况的组合,只不过统计的结果顺序不同而已。但是对于 rollup 来说，列的顺序不同，则结果不同。

如果是GROUP BY CUBE(A, B, C)，GROUP BY顺序：
(A、B、C)
(A、B)
(A、C)
(A)，
(B、C)
(B)
(C)，
最后对全表进行GROUPBY操作。

这里写图片描述

##2.6 grouping

用于区分 原有值 和 统计项

參数仅仅有一个,并且必须为group by中出现的某一列
grouping = 0 : 数据库中本来的值
grouping = 1 : 统计的结果

这里写图片描述

##2.7 grouping_id

区分 小计项 和 合计项。Grouping_id()的返回值事实上就是參数中的每列的grouping()值的二进制向量。假设grouping(a)=1，grouping(b)=1，则grouping_id(A,B)的返回值就是二进制的11。转成10进制就是3。

參数能够是多个，但必须为group by中出现的列。
grouping 用于判断 小计项（grouping(A) = 1）
grouping_id 用于判断 合计项（grouping(A, B) = 1 + 1 = 3；小计 + 小计 = 合计）

这里写图片描述

##2.8 group_id

GROUP_ID()唯一标识反复组，能够通过group_id去除反复组

group_id()函数，无参数
0表示第一次，1表示重复。

这里写图片描述

高级分组函数（rollup、cube、grouping sets）

猜你喜欢