ORACLE学习笔记系列（15）使用扩张的 GROUP BY 子句

2014-01-17

ORACLE学习笔记系列（15）使用扩展的 GROUP BY 子句GROUP BY 可选项什么时候可以无：非分组查询中，聚合函数实

ORACLE学习笔记系列（15）使用扩展的 GROUP BY 子句
GROUP BY 可选项什么时候可以无：非分组查询中，聚合函数实际上等于将表中所有记录作为一个组来运算。此时在 select列表中指定的列只能是包含聚组函数，不能包含数据表本身的列。比如求所有员工的总工资:SELECT SUM(SALARY) FROM EMP;什么时候必须有：在分组查询中，聚合函数是将数据按分组关键字分组，然后对每一组的函数自变量中的内容进行聚合运算。Select 子句字段可以是分组关键字（group by 后面字段）和聚合函数。比如求各个部门员工总工资:SELECT DEPTNAME, SUM(SALARY) FROM EMP GROUP BY EMP.DEPTNAME;注意：a.如果没有group by 子句，select 列表中不允许出现字段与分组函数混用的情况。b.在带有group by子句的查询语句中，在select列表中指定的列要么是group by 子句中指定的列，要么包含聚组函数。出现在select列表中的字段，如果不是包含在分组函数中，那么该字段必须同时出在Group by子句中。c.group by后面字段的顺序不同分组结果不同。

/*--设置输出格式SET linesize 1000;SET pagesize 25;COLUMN deptno format A10;COLUMN DEPTNAME format A10;COLUMN job format A6;COLUMN NAME format A25; COLUMN lev format A10; */-- 建表：EMPcreate table EMP(  id       NUMBER(4),  deptno   VARCHAR2(50),  deptname VARCHAR2(50),  job      VARCHAR2(50),  name     VARCHAR2(50),  lev      VARCHAR2(50),  salary   NUMBER(16,2)); -- EMP表数据SQL> SELECT * FROM EMP;        ID DEPTNO     DEPTNAME   JOB    NAME                      LEV            SALARY---------- ---------- ---------- ------ ------------------------- ---------- ----------         1            BUS        PRE    James Smith                                2000         2            SAL        MGR    Ron Johnson                                 875         3            SAL        WOR    Fred Hobbs                                  350         4            SUP        MGR    Susan Jones                                 500         5            SAL        WOR    Rob Green                                   875         6            SUP        WOR    Jane Brown                                  500         7            SUP        MGR    John Grey                                 662.5         8            SUP        WOR    Jean Blue                                   275         9            SUP        WOR    Henry Heyson                              312.5        10            OPE        MGR    Kevin Black                               562.5        11            OPE        MGR    Keith Long                                412.5        12            OPE        WOR    Frank Howard                              312.5        13            OPE        WOR    Doreen Penn                               362.5        14            BUS        MGR    Mark Smith                                387.5        15            BUS        MGR    Jill Jones                                437.5        16            OPE        ENG    Megan Craig                               612.5        17            SUP        TEC    Matthew Brant                             287.5        18            OPE        MGR    Tony Clerke                                 500        19            BUS        MGR    Tanya Conway                                500        20            OPE        MGR    Terry Cliff                               537.5        21            SAL        MGR    Steve Green                               687.5        22            SAL        MGR    Roy Red                                   937.5        ID DEPTNO     DEPTNAME   JOB    NAME                      LEV            SALARY---------- ---------- ---------- ------ ------------------------- ---------- ----------        23            SAL        MGR    Sandra Smith                              837.5        24            SAL        MGR    Gail Silver                               562.5        25            SAL        MGR    Gerald Gold                               612.5        26            SAL        MGR    Eileen Lane                               587.5        27            SAL        MGR    Doreen Upton                              587.5        28            SAL        MGR    Jack Ewing                                587.5        29            SAL        MGR    Paul Owens                                612.5        30            SAL        MGR    Melanie York                              637.5        31            SAL        MGR    Tracy Yellow                              562.5        32            SAL        MGR    Sarah White                               587.5        33            SAL        MGR    Terry Iron                                562.5        34            SAL        MGR    Christine Brown                           617.5        35            SAL        MGR    John Brown                                622.5        36            SAL        MGR    Kelvin Trenton                            637.5        37            BUS        WOR    Damon Jones                                 700已选择37行。---- GROUP BY 的结果SQL> SELECT DEPTNAME, SUM(SALARY) FROM EMP GROUP BY DEPTNAME;DEPTNAME   SUM(SALARY)---------- -----------SUP             2537.5SAL              12340BUS               4025OPE               3300SQL>

 1、使用 ROLLUP子句   ROLLUP 是GROUP BY子句的扩展，它是为每一个分组返回一条合计记录，并为全部分组返回总计。   ROLLUP 可以按单列进行分组，与可以向 ROLLUP 传递多列。   ROLLUP 按照多列进行分组时，Rollup 后面跟了n个字段，就将进行n+1次分组，从左到右每次减少一个字段进行分组；   然后进行union操作。       例如 ROLLUP(A, B, C)，则执行顺序如下：     （1）首先对(A、B、C)进行GROUP BY，     （2）然后对(A、B)进行GROUP BY，     （3）然后是(A)进行GROUP BY，     （4）然后对全表进行GROUP BY,     （5）最后将以上四步的结果进行union操作。   示例：-- ROLLUP一个字段：SQL> SELECT DEPTNAME, SUM(SALARY) FROM EMP GROUP BY ROLLUP(DEPTNAME);DEPTNAME   SUM(SALARY)---------- -----------BUS               4025OPE               3300SAL              12340SUP             2537.5               22202.5-- 等价于SQL> SELECT DEPTNAME, SUM(SALARY) FROM EMP GROUP BY DEPTNAME  2  UNION  3  SELECT '', SUM(SALARY) FROM EMP;DEPTNAME   SUM(SALARY)---------- -----------BUS               4025OPE               3300SAL              12340SUP             2537.5               22202.5-- ROLLUP两个字段：SQL> SELECT DEPTNAME, JOB, SUM(SALARY) FROM EMP GROUP BY ROLLUP(DEPTNAME, JOB);DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS        MGR           1325BUS        PRE           2000BUS        WOR            700BUS                      4025OPE        ENG          612.5OPE        MGR         2012.5OPE        WOR            675OPE                      3300SAL        MGR          11115SAL        WOR           1225SAL                     12340SUP        MGR         1162.5SUP        TEC          287.5SUP        WOR         1087.5SUP                    2537.5                      22202.5已选择16行。-- 等价于SQL> SELECT DEPTNAME, JOB, SUM(SALARY) FROM EMP GROUP BY DEPTNAME, JOB  2  UNION  3  SELECT DEPTNAME,'', SUM(SALARY) FROM EMP GROUP BY DEPTNAME  4  UNION  5  SELECT '','', SUM(SALARY) FROM EMP ;DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS        MGR           1325BUS        PRE           2000BUS        WOR            700BUS                      4025OPE        ENG          612.5OPE        MGR         2012.5OPE        WOR            675OPE                      3300SAL        MGR          11115SAL        WOR           1225SAL                     12340SUP        MGR         1162.5SUP        TEC          287.5SUP        WOR         1087.5SUP                    2537.5                      22202.5已选择16行。SQL>--合计行的分组列会显示为空，可进行转换SQL> SELECT NVL(DEPTNAME, '合计') DEPTNAME, SUM(SALARY) FROM EMP GROUP BY ROLLUP(DEPTNAME);DEPTNAME   SUM(SALARY)---------- -----------BUS               4025OPE               3300SAL              12340SUP             2537.5合计           22202.5SQL> SELECT NVL(DEPTNAME, '合计') DEPTNAME, NVL(JOB, '小计') JOB, SUM(SALARY) FROM EMP GROUP BY ROLLUP(DEPTNAME, JOB);DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS        MGR           1325BUS        PRE           2000BUS        WOR            700BUS        小计          4025OPE        ENG          612.5OPE        MGR         2012.5OPE        WOR            675OPE        小计          3300SAL        MGR          11115SAL        WOR           1225SAL        小计         12340SUP        MGR         1162.5SUP        TEC          287.5SUP        WOR         1087.5SUP        小计        2537.5合计       小计       22202.5已选择16行。SQL>

 2、使用 CUBE子句 CUBE子句也是对GROUP BY子句进行扩展，返回CUBE中所有列组合的小计信息，同时在最后显示总计信息。CUBE这里的使用与ROLLUP基本相同，但CUBE的合计更加详细，它能够显示出分组字段的合计信息。  在Group By 中使用Cube可以产生Rollup结果集+和多维度的交叉表数据源。Cube 后面跟了n个字段，就将进行2的N次方的分组运算，然后进行union；例如 GROUP BY CUBE(A, B, C)，则执行顺序如下：    （1）首先会对 (A、B、C) 进行GROUP BY，    （2）然后是对 (A、B) 进行GROUP BY，    （3）然后是对 (A、C) 进行GROUP BY，    （4）然后是对 (A) 进行GROUP BY，    （5）然后是对 (B、C) 进行GROUP BY，    （6）然后是对 (B) 进行GROUP BY，    （7）然后是对 (C) 进行GROUP BY，    （8）然后对全表进行GROUP BY,    （9）最后将以上的结果进行union操作。 -- GROUP BY CUBE 一个字段时，与ROLLUP一个字段，是等价的。SELECT DEPTNAME, SUM(SALARY) FROM EMP GROUP BY ROLLUP(DEPTNAME);SELECT DEPTNAME, SUM(SALARY) FROM EMP GROUP BY CUBE(DEPTNAME) ORDER BY DEPTNAME;--等价于SELECT DEPTNAME, SUM(SALARY) FROM EMP GROUP BY DEPTNAMEUNIONSELECT '', SUM(SALARY) FROM EMP;   -- GROUP BY CUBE 两个字段时SELECT DEPTNAME, JOB, SUM(SALARY) FROM EMP GROUP BY CUBE(DEPTNAME, JOB) ORDER BY DEPTNAME;--等价于SELECT DEPTNAME, JOB, SUM(SALARY) FROM EMP GROUP BY DEPTNAME, JOB  UNIONSELECT DEPTNAME,'', SUM(SALARY) FROM EMP GROUP BY DEPTNAME  UNIONSELECT '', JOB, SUM(SALARY) FROM EMP GROUP BY JOB  UNIONSELECT '','', SUM(SALARY) FROM EMP ;-- GROUP BY CUBE 两个字段时SQL> SELECT DEPTNAME, JOB, SUM(SALARY) FROM EMP GROUP BY CUBE(DEPTNAME, JOB) ORDER BY DEPTNAME;DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS        MGR           1325BUS        PRE           2000BUS        WOR            700BUS                      4025OPE        ENG          612.5OPE        MGR         2012.5OPE        WOR            675OPE                      3300SAL        MGR          11115SAL        WOR           1225SAL                     12340SUP        MGR         1162.5SUP        TEC          287.5SUP        WOR         1087.5SUP                    2537.5           ENG          612.5           MGR          15615           PRE           2000           TEC          287.5           WOR         3687.5                      22202.5已选择21行。SQL> SELECT NVL(DEPTNAME, '合计') DEPTNAME, NVL(JOB, '小计') JOB, SUM(SALARY) FROM EMP GROUP BY CUBE(DEPTNAME, JOB) ORDER BY DEPTNAME;DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS        小计          4025BUS        MGR           1325BUS        PRE           2000BUS        WOR            700OPE        小计          3300OPE        MGR         2012.5OPE        WOR            675OPE        ENG          612.5SAL        MGR          11115SAL        WOR           1225SAL        小计         12340SUP        TEC          287.5SUP        WOR         1087.5SUP        MGR         1162.5SUP        小计        2537.5合计       ENG          612.5合计       小计       22202.5合计       MGR          15615合计       PRE           2000合计       TEC          287.5合计       WOR         3687.5已选择21行。SQL>

 3、使用 GROUPING()函数GROUPING()可接受一个列值，当列值为空时，函数返回1；如果列值非空，则返回0。（注意：GROUPING()只能在ROLLUP、CUBE查询中使用。还可以结合DECODE（）函数来注释使用更好）示例： --GROUPING()与ROLLUP结合使用SQL> SELECT GROUPING(DEPTNAME), DEPTNAME, SUM(SALARY)  2    FROM EMP  3   GROUP BY ROLLUP(DEPTNAME);GROUPING(DEPTNAME) DEPTNAME   SUM(SALARY)------------------ ---------- -----------                 0 BUS               4025                 0 OPE               3300                 0 SAL              12340                 0 SUP             2537.5                 1                22202.5--使用DECODE（）函数来转换：SQL> SELECT DECODE(GROUPING(DEPTNAME), 1, '合计', DEPTNAME) AS DEPTNAME,  2         DEPTNAME,  3         SUM(SALARY)  4    FROM EMP  5   GROUP BY ROLLUP(DEPTNAME);DEPTNAME   DEPTNAME   SUM(SALARY)---------- ---------- -----------BUS        BUS               4025OPE        OPE               3300SAL        SAL              12340SUP        SUP             2537.5合计                      22202.5--GROUPING()与CUBE结合使用SQL> SELECT DECODE(GROUPING(DEPTNAME), 1, '合计', DEPTNAME) AS DEPTNAME,  2         DECODE(GROUPING(JOB), 1, '小计', JOB) AS JOB,  3         SUM(SALARY)  4    FROM EMP  5   GROUP BY CUBE(DEPTNAME, JOB)  6   ORDER BY DEPTNAME, JOB;DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS        MGR           1325BUS        PRE           2000BUS        WOR            700BUS        小计          4025OPE        ENG          612.5OPE        MGR         2012.5OPE        WOR            675OPE        小计          3300SAL        MGR          11115SAL        WOR           1225SAL        小计         12340SUP        MGR         1162.5SUP        TEC          287.5SUP        WOR         1087.5SUP        小计        2537.5合计       ENG          612.5合计       MGR          15615合计       PRE           2000合计       TEC          287.5合计       WOR         3687.5合计       小计       22202.5已选择21行。SQL>

4、使用 GROUPING SETS子句下面使用 GROUPING SETS子句来限制只返回小计记录。 也可以使用 GROUPING SETS子句 来代替多次UNION。GROUPING SETS子句可以按单一字段分组，也可以按组合字段分组。例如 按单一字段分组GROUP BY GROUPING SETS(A, B)，则执行顺序如下：    （1）首先是对 (A) 进行GROUP BY，    （2）然后是对 (B) 进行GROUP BY，    （3）最后将以上的结果进行union操作。     例如 按组合字段分组GROUP BY GROUPING SETS((A, B),(C,D))，则执行顺序如下：    （1）首先是对 (A,B) 进行GROUP BY，    （2）然后是对 (C,D) 进行GROUP BY，    （3）最后将以上的结果进行union操作。      -- 按单一字段分组SQL> SELECT DEPTNAME, JOB, SUM(SALARY)  2     FROM EMP  3    GROUP BY GROUPING SETS(DEPTNAME, JOB)  4    ORDER BY DEPTNAME, JOB;DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS                      4025OPE                      3300SAL                     12340SUP                    2537.5           ENG          612.5           MGR          15615           PRE           2000           TEC          287.5           WOR         3687.5已选择9行。SQL>--等价于 SQL> SELECT DEPTNAME, '' AS JOB, SUM(SALARY) FROM EMP GROUP BY DEPTNAME  2     UNION  3  SELECT '' AS DEPTNAME, JOB, SUM(SALARY) FROM EMP GROUP BY JOB;DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS                      4025OPE                      3300SAL                     12340SUP                    2537.5           ENG          612.5           MGR          15615           PRE           2000           TEC          287.5           WOR         3687.5已选择9行。SQL>

5、使用 GROUPING_ID()函数 GROUPING_ID（）函数可接受一列或多列，它返回GROUPING位向量的十进制值。GROUPING位向量的计算方法是按照顺序对每一列调用GROUPING（）函数的结果组合起来。它的作用是借助HAVING子句对记录进行过滤，将不包含小计或总计的记录除去。GROUPING位向量的十进制值，我们由前面的介绍已知道当GROUPING（）的列值为空时它返回1，当非空时返回0；比如：GROUPING_ID(DIVISION_ID, JOB_ID)division_id,job_id两列都为非空，  GROUPING（）都返回0。将这两列的值组合起来，形成一个位向量00，十进制为0。division_id列为非空,job_id列为空，GROUPING（）都返回1。将这两列的值组合起来，形成一个位向量01，十进制为1。division_id列为空,job_id列为非空，GROUPING（）都返回2。将这两列的值组合起来，形成一个位向量10，十进制为2。division_id,job_id两列都为空，    GROUPING（）都返回3。将这两列的值组合起来，形成一个位向量11，十进制为3。（这里要特别注意division_id与job_id两列的顺序，如果顺序不一样返回的结果值可能不一样。）示例：SQL> SELECT DEPTNAME,  2         JOB,  3         GROUPING(DEPTNAME) AS DEP,  4         GROUPING(JOB) AS J,  5         GROUPING_ID(DEPTNAME, JOB) AS GRP_ID,  6         SUM(SALARY)  7    FROM EMP  8   GROUP BY CUBE(DEPTNAME, JOB)  9   ORDER BY DEPTNAME, JOB;DEPTNAME   JOB           DEP          J     GRP_ID SUM(SALARY)---------- ------ ---------- ---------- ---------- -----------BUS        MGR             0          0          0        1325BUS        PRE             0          0          0        2000BUS        WOR             0          0          0         700BUS                        0          1          1        4025OPE        ENG             0          0          0       612.5OPE        MGR             0          0          0      2012.5OPE        WOR             0          0          0         675OPE                        0          1          1        3300SAL        MGR             0          0          0       11115SAL        WOR             0          0          0        1225SAL                        0          1          1       12340SUP        MGR             0          0          0      1162.5SUP        TEC             0          0          0       287.5SUP        WOR             0          0          0      1087.5SUP                        0          1          1      2537.5           ENG             1          0          2       612.5           MGR             1          0          2       15615           PRE             1          0          2        2000           TEC             1          0          2       287.5           WOR             1          0          2      3687.5                           1          1          3     22202.5已选择21行。--使用GROUPING_ID过滤不包含小计或总计的记录：SQL> SELECT DEPTNAME,  2         JOB,  3         GROUPING(DEPTNAME) AS DEP,  4         GROUPING(JOB) AS J,  5         GROUPING_ID(DEPTNAME, JOB) AS GRP_ID,  6         SUM(SALARY)  7    FROM EMP  8   GROUP BY CUBE(DEPTNAME, JOB)  9  HAVING GROUPING_ID(DEPTNAME, JOB) > 0 10   ORDER BY DEPTNAME, JOB;DEPTNAME   JOB           DEP          J     GRP_ID SUM(SALARY)---------- ------ ---------- ---------- ---------- -----------BUS                        0          1          1        4025OPE                        0          1          1        3300SAL                        0          1          1       12340SUP                        0          1          1      2537.5           ENG             1          0          2       612.5           MGR             1          0          2       15615           PRE             1          0          2        2000           TEC             1          0          2       287.5           WOR             1          0          2      3687.5                           1          1          3     22202.5已选择10行。SQL>--使用GROUPING_ID来进行合计的注注释SQL> SELECT DECODE(GROUPING_ID(DEPTNAME, JOB), 3, '总合计', 2, '合计', DEPTNAME) AS DEPTNAME,  2         DECODE(GROUPING_ID(DEPTNAME, JOB), 3, '总合计', 1, '小计', JOB) AS JOB,  3         SUM(SALARY)  4    FROM EMP  5   GROUP BY CUBE(DEPTNAME, JOB)  6   ORDER BY DEPTNAME, JOB;DEPTNAME   JOB    SUM(SALARY)---------- ------ -----------BUS        MGR           1325BUS        PRE           2000BUS        WOR            700BUS        小计          4025OPE        ENG          612.5OPE        MGR         2012.5OPE        WOR            675OPE        小计          3300SAL        MGR          11115SAL        WOR           1225SAL        小计         12340SUP        MGR         1162.5SUP        TEC          287.5SUP        WOR         1087.5SUP        小计        2537.5合计       ENG          612.5合计       MGR          15615合计       PRE           2000合计       TEC          287.5合计       WOR         3687.5总合计     总合计     22202.5已选择21行。SQL>

6、使用 GROUP_ID()函数   在 GROUP BY 子句中可以多次使用某个列，这样可以实现对数据的重新组织，或是按照不同的数据分组进行统计。   如下面这个查询中包含一个 GROUP BY 子句，其中使用了两次 DEPTNAME 列，第一次是对 DEPTNAME 进行分组，   第二次是在 ROLLOUP 中使用。从结果可以看到最后4行与前面4行是重复的。   这种现象可以通过使用 GROUP_ID() 函数来消除。      GROUP_ID()函数用于消除 GROUP BY 子句返回的重复记录。   GROUP_ID()函数不接收任何参数。   如果某个特定的分组重复出现 N 次，那么 GROUP_ID() 函数返回从 0 到 N-1 之间的一个整数。   -- GROUP BY 子句返回重复记录   SQL> SELECT DEPTNAME, JOB, GROUP_ID(), SUM(SALARY)  2    FROM EMP  3   GROUP BY DEPTNAME, ROLLUP(DEPTNAME, JOB);DEPTNAME   JOB    GROUP_ID() SUM(SALARY)---------- ------ ---------- -----------BUS        MGR             0        1325BUS        PRE             0        2000BUS        WOR             0         700OPE        ENG             0       612.5OPE        MGR             0      2012.5OPE        WOR             0         675SAL        MGR             0       11115SAL        WOR             0        1225SUP        MGR             0      1162.5SUP        TEC             0       287.5SUP        WOR             0      1087.5BUS                        0        4025OPE                        0        3300SAL                        0       12340SUP                        0      2537.5BUS                        1        4025OPE                        1        3300SAL                        1       12340SUP                        1      2537.5已选择19行。SQL>在上面的例子中，除了最后 4 条记录之外，GROUP_ID()函数在其他记录上返回值都是0；最后4条记录与前面4条记录重复，因此GROUP_ID()函数返回1。可使用 HAVING 子句消除重复记录，只返回GROUP_ID()函数等于0的记录。SQL> SELECT DEPTNAME, JOB, GROUP_ID(), SUM(SALARY)  2    FROM EMP  3   GROUP BY DEPTNAME, ROLLUP(DEPTNAME, JOB)  4  HAVING GROUP_ID() = 0;DEPTNAME   JOB    GROUP_ID() SUM(SALARY)---------- ------ ---------- -----------BUS        MGR             0        1325BUS        PRE             0        2000BUS        WOR             0         700OPE        ENG             0       612.5OPE        MGR             0      2012.5OPE        WOR             0         675SAL        MGR             0       11115SAL        WOR             0        1225SUP        MGR             0      1162.5SUP        TEC             0       287.5SUP        WOR             0      1087.5BUS                        0        4025OPE                        0        3300SAL                        0       12340SUP                        0      2537.5已选择15行。SQL>

热点排行

其他数据库

ORACLE学习笔记系列（15）使用扩张的 GROUP BY 子句