Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL

2013-07-27

Oracle 连接查询，字表多行字段合并为一行，以逗号分隔的查询SQL?步骤1.test_main建表SQL：create table test

Oracle 连接查询，字表多行字段合并为一行，以逗号分隔的查询SQL

步骤

test_main建表SQL：

create table test_main(       m_id number not null,       m_name varchar(10),       constraint test_main_pk primary key(m_id))

?test_sub建表SQL：

create table test_sub(       s_id number,       m_id number,       s_name varchar(10),       constraint test_sub_pk primary key(s_id),       constraint test_sub_fk foreign key(m_id) references test_main(m_id))

2.插入数据：

test_main?
Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL

?test_sub? ? ? ? ? ? ? ? ? ? ? ?
Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL
?

3.查询SQL

select m_name,        ltrim(max(sys_connect_by_path(s_name, ',')), ',') as sub_namesfrom (       select m_name, s_name, m_id, rn1,                lead(rn1) over(partition by m_id order by rn1) rn2         from (                select core.*, row_number() over(order by core.m_id desc) rn1                from (                               select m.m_name, s.m_id, s.s_name                       from test_main m                        join test_sub s on m.m_id = s.m_id                     ) core                   )tmp     )tmp2start with rn2 is nullconnect by rn2 = prior rn1group by m_id, m_name

------------------------------------------------------------------------------------------------------------

?听我解析。。。

1. 看core 子表，是业务核心SQL，目的是查出想要的所有记录，后边的处理是要对查出的这堆记录进行处理的。

 select m.m_name, s.m_id, s.s_name from test_main m  join test_sub s on m.m_id = s.m_id

结果：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL
?

2. 看tmp子表，先看row_number() over( [partition by col_g] ?order by col1 [, col2, ...] ), 这一函数表示若有partition字句，先根据col_g进行分组，在分组内根据col1 [, col2, ....]排序，然后返回每组内部排序后的顺序编号（组内连续的唯一的），若无partition字句，表示不分组，排序后当成一个大组。这与rownum的区别在于：使用rownum进行排序的时候是先对结果集加入伪劣rownum然后再进行排序，而此函数在包含排序从句后是先排序再计算行号码。?

row_number()和rownum差不多，功能更强一点（可以在各个分组内从1开始排序）。?

如下SQL，根据m_id排个序然后给个rownumber rn1

 select core.*, row_number() over(order by core.m_id desc) rn1 from (                      select m.m_name, s.s_name, s.m_id              from test_main m                join test_sub s on m.m_id = s.m_id         ) core

?结果：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL
?

?3.看tmp2 子表，先看lead(col [, offset] [, default] )?over( [partition by col_g] ?order by col1 [, col2, ...] ) ，lead为返回相对当前行记录后offset行字段col的值，default为若col的值为null时返回的值，不指定默认为null， offset不指定默认为1，若为负数，则表示相对当前行记录的后offset行（要看oracle版本，有些貌似不支持负数）。

以test_sub表为例，先看以下SQL：

select s_id, lead(s_id) over(order by s_id asc) as sidfrom test_sub

?意思是查出s_id和此s_id 的下一行s_id的值，结果：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL
?

再看SQL:

select s_id, m_id, lead(s_id) over(partition by m_id order by s_id asc) as sidfrom test_sub

?加入分组后，则lead操作的范围缩小到组里面了，先看结果：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL
?对比上面没有partition的SQL结果可以发现，s_id为3的记录此处sid为空，那是因为在m_id为1的组里，s_id为3的记录是最后的记录了，所以它往后的不存在的行记录的s_id 的值必然为null。而在没有partition的情况下s_id为3的记录往后的行记录是s_id 为4的那个，所以lead出来是4。

回到tmp2子表上面，SQL：

 select m_name, s_name, m_id, rn1,        lead(rn1) over(partition by m_id order by rn1) rn2 from (          select core.*, row_number() over(order by core.m_id desc) rn1          from (                           select m.m_name, s.s_name, s.m_id                   from test_main m                    join test_sub s on m.m_id = s.m_id                ) core            )tmp

?结果：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL

4.先看start with...connect by 字句。。。

Start with...Connect By子句递归查询一般用于一个表维护树形结构的应用。

在此另举以案例说明之：

? ?1）创建示例表

CREATE TABLE TBL_TEST(  ID    NUMBER,  NAME  VARCHAR2(100 BYTE),  PID   NUMBER                                  DEFAULT 0);

2）插入数据如下：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL

从上面的记录中id与pid的关系可以得出此时所有记录可以抽象出一棵树：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL
?3）测试SQL：

select * from TBL_TEST start with id=1 connect by prior id = pid

?意思是从id为1的节点开始遍历其所有子节点，结果：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL

从结果看，这是个先序遍历（有关二叉树且看在下所作笔记：http://gwoham-163-com.iteye.com/blog/1896260），或自行google。至于oracle底层如何执行，恕在下愚钝。。。

再看start with 是指定从那个节点开始遍历；注意此处connect by prior id = pid，prior为优先之意，此处为id优先，则整个SQL表示遍历id为1节点的所有子节点。若改为connect by prior pid = id则变成遍历其所有父节点了。

再看SQL：

 select * from TBL_TEST start with id=5 connect by prior pid = id

?意思是遍历id为5的节点的所有父节点（不包括最root节点，应为id为0的记录没有），结果：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL

以上好好顿悟就行了，言不尽意。。。或者找google要更全的资料。

?了解了start with...connect by子句是以遍历树的方式查询出记录，分析下面SQL，意思是在tmp2这个具有树形结构数据的子表中遍历RN2为空的节点（RN2为child，RN1为parent）的所有父节点：

select m_name, rn1, rn2   from (       select m_name, s_name, m_id, rn1,              lead(rn1) over(partition by m_id order by rn1) rn2        from (                select core.*, row_number() over(order by core.m_id desc) rn1                from (                               select m.m_name, s.s_name, s.m_id                       from test_main m                        join test_sub s on m.m_id = s.m_id                     ) core                   )tmp     )tmp2start with rn2 is nullconnect by rn2 = prior rn1

?给出tmp2的数据的树状图：

? Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL
?三棵树分别是Oham,Lulu,Cancan ；红色部分为root节点，实际不存在的记录。

三棵树分别遍历，结果为：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL

但问题是为什么要遍历这样的树呢？先看看sys_connect_by_path(node_col, conn_sbl)此函数，其意思是让你把节点字段node_col按照当前遍历路径用conn_sbl符号连接起来，建议自行google深入了解。

执行SQL：

select m_name, rn1, rn2, s_name,       sys_connect_by_path(s_name, ',') as sub_namesfrom (       select m_name, s_name, m_id, rn1,                lead(rn1) over(partition by m_id order by rn1) rn2         from (                select core.*, row_number() over(order by core.m_id desc) rn1                from (                               select m.m_name, s.m_id, s.s_name                       from test_main m                        join test_sub s on m.m_id = s.m_id                     ) core                   )tmp     )tmp2start with rn2 is nullconnect by rn2 = prior rn1

?因为当前prior指定是RN1优先（遍历父节点），而sys_connect_by_path函数就把当前节点其下的子节点以及自己（从最下至上）用逗号拼接在一起（说实话在下还不太明白按当前路径之说法什么意思，但若把优先改成RN2，遍历子节点，那sys_connect_by_path就把其上的父节点以及自己从最上至下拼接），结果：

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL
?
?接下来就简单了，就上面的结果简单整理一下就行了，按m_name分组，取sub_names值最长的记录，把左边的逗号trim掉，然后大功告成。

执行SQL：

select m_name,       ltrim(max (sys_connect_by_path(s_name, ',')), ',') as sub_namesfrom (       select m_name, s_name, m_id, rn1,                lead(rn1) over(partition by m_id order by rn1) rn2         from (                select core.*, row_number() over(order by core.m_id desc) rn1                from (                               select m.m_name, s.m_id, s.s_name                       from test_main m                        join test_sub s on m.m_id = s.m_id                     ) core                   )tmp     )tmp2start with rn2 is nullconnect by rn2 = prior rn1group by m_name

真他妈累。。。

?----------------------------------------------------------------------------------------------------------

整理思路一下：

? ? ? ? ? ? ? ? ? ? ?1.core是查出所有想要的数据。

? ? ? ? ? ? ? ? ? ? ?2.tmp是对core的数据加入行序号。

? ? ? ? ? ? ? ? ? ? ?3.tmp2是利用tmp中的行序号作分组lead操作，目的是构造出具有父子关系（树状）的数据形式 ——RN1为父，RN2为子，对应回test_main与test_sub的一对多主从关系。

? ? ? ? ? ? ? ? ? ? ?4.有了tmp2具有树状结构的数据记录，结合start with...connect by语句，运用sys_connect_by_path函数查询出拼接出逗号的字段值。

? ? ? ? ? 5.最后对结果进行分组修饰处理。

热点排行

SQL Server

Oracle 联接查询，字表多行字段合并为一行，以逗号分隔的查询SQL