PostgreSQL_樹形結構的遞歸查詢

背景

處理不肯定深度的層級結構,好比組織機構,一個經常使用的設計是在一張表裏面保存 ID 和 Parent_ID ,而且經過自聯結的辦法構造一顆樹。這種方式對寫數據的過程很友好,可是查詢過程就變得相對複雜。在不引入MPTT模型的前提下,必須經過遞歸算法來查詢某個節點和下級子節點。html

Oracle提供的connect by擴展語法,簡單好用。可是其餘的RDBMS就沒這麼人性化了(或者我不知道)。最近在項目中使用PostgreSQL來查詢樹形數據,記錄一下。算法

構造樣本數據

drop table if exists demo.tree_data;
create table demo.tree_data (
    id integer,
    code text,
    pid integer,
    sort integer
);

insert into demo.tree_data values(1, '中國', null, 1);
insert into demo.tree_data values(2, '四川', 1, 1);
insert into demo.tree_data values(3, '雲南', 1, 2);
insert into demo.tree_data values(4, '成都', 2, 1);
insert into demo.tree_data values(5, '綿陽', 2, 2);	
insert into demo.tree_data values(6, '武侯區', 4, 1);
insert into demo.tree_data values(7, '昆明', 3, 1);	
複製代碼

connectby函數

若是安裝了 tablefunc 擴展,就可使用PG版本的connectby函數。這個沒有Oracle那麼強大,可是能夠知足基本要求。sql

-- API 以下
connectby(text relname, 			-- 表名稱
          text keyid_fld, 			-- id字段
          text parent_keyid_fld		-- 父id字段 
          [, text orderby_fld ], 	-- 排序字段
          text start_with, 			-- 起始行的id值
          int max_depth				-- 樹深度,0表示無限
          [, text branch_delim ])	-- 路徑分隔符
複製代碼
-- 基本用法以下,必須經過AS子句定義返回的字段名稱和類型
select * 
	from connectby('demo.tree_data', 'id', 'pid', 'sort', '1', 0, '~')
	as (id int, pid int, lvl int, branch text, sort int);
	
-- 查詢結果
id | pid | lvl | branch  | sort
----+-----+-----+---------+------
  1 |     |   0 | 1       |    1
  2 |   1 |   1 | 1~2     |    2
  4 |   2 |   2 | 1~2~4   |    3
  6 |   4 |   3 | 1~2~4~6 |    4
  5 |   2 |   2 | 1~2~5   |    5
  3 |   1 |   1 | 1~3     |    6
  7 |   3 |   2 | 1~3~7   |    7
(7 rows)
複製代碼
-- 僅僅使用基本用法,只能查詢出id的相關信息,若是要查詢code等其餘字段,就須要經過額外的join操做來實現。
select 
	t.id, n.code, t.pid, p.code as pcode, lvl, branch
from (
	select * from connectby('demo.tree_data', 'id', 'pid', 'sort', '1', 0, '~')
		as (id int, pid int, lvl int, branch text, sort int)
) as t
	left join demo.tree_data as n on (t.id = n.id)
	left join demo.tree_data as p on (t.pid = p.id)
order by t.sort ;	

 id |  code  | pid | pcode | lvl | branch
----+--------+-----+-------+-----+---------
  1 | 中國   |     |       |   0 | 1
  2 | 四川   |   1 | 中國  |   1 | 1~2
  4 | 成都   |   2 | 四川  |   2 | 1~2~4
  6 | 武侯區 |   4 | 成都  |   3 | 1~2~4~6
  5 | 綿陽   |   2 | 四川  |   2 | 1~2~5
  3 | 雲南   |   1 | 中國  |   1 | 1~3
  7 | 昆明   |   3 | 雲南  |   2 | 1~3~7
(7 rows)
複製代碼

PS:雖然經過join能夠查詢出節點的code,可是branch部分不能直接轉換成對應的code,使用上仍是不太方便。函數

CTE語法

使用CTE語法,經過 with recursive 來實現樹形數據的遞歸查詢。這個方法雖然沒有connectby那麼直接,可是靈活性和顯示效果更好。post

-- 
with recursive cte as
(
  -- 先查詢root節點 
  select
    id, code, pid, '' as pcode,
    code as branch
  from  demo.tree_data where id = 1
  union all
  -- 經過cte遞歸查詢root節點的直接子節點 
  select
    origin.id, origin.code, cte.id as pid, cte.code as pcode,
    cte.branch || '~' || origin.code
  from cte
  join demo.tree_data as origin on origin.pid = cte.id
)
select
  id,code, pid, pcode, branch, 
  -- 經過計算分隔符的個數,模擬計算出樹形的深度
  (length(branch)-length(replace(branch, '~', ''))) as lvl
from cte;

-- 
 id |  code  | pid | pcode |        branch         | lvl
----+--------+-----+-------+-----------------------+-----
  1 | 中國   |     |      | 中國                 |   0
  2 | 四川   |   1 | 中國  | 中國~四川            |   1
  3 | 雲南   |   1 | 中國  | 中國~雲南            |   1
  4 | 成都   |   2 | 四川  | 中國~四川~成都        |   2
  5 | 綿陽   |   2 | 四川  | 中國~四川~綿陽        |   2
  7 | 昆明   |   3 | 雲南  | 中國~雲南~昆明        |   2
  6 | 武侯區 |   4 | 成都  | 中國~四川~成都~武侯區   |   3
(7 rows)
複製代碼

執行過程說明ui

從上面的例子能夠看出,WITH RECURSIVE語句包含了兩個部分spa

  • non-recursive term(非遞歸部分),即上例中的union all前面部分
  • recursive term(遞歸部分),即上例中union all後面部分

執行步驟以下設計

  1. 執行non-recursive term。(若是使用的是union而非union all,則需對結果去重)其結果做爲recursive term中對result的引用,同時將這部分結果放入臨時的working table中
  2. 重複執行以下步驟,直到working table爲空:用working table的內容替換遞歸的自引用,執行recursive term,(若是使用union而非union all,去除重複數據),並用該結果(若是使用union而非union all,則是去重後的結果)替換working table

以上面的query爲例,來看看具體過程postgresql

  1. 執行non-recursive query
-- step 1 執行
  select
    id, code, pid, '' as pcode,
    code as branch
  from  demo.tree_data where id = 1
  
-- 結果集和working table爲
 id | code | pid | pcode | branch
----+------+-----+-------+--------
  1 | 中國 |     |       | 中國
複製代碼
  1. 執行recursive query
-- step 2 執行遞歸,此時自引用cte中的數據是step 1的結果
  select
    origin.id, origin.code, cte.id as pid, cte.code as pcode,
    cte.branch || '~' || origin.code
  from cte
  join demo.tree_data as origin on origin.pid = cte.id
  
 -- 結果集和working table爲
  id |  code  | pid | pcode |        branch        
----+--------+-----+-------+---------------------
  2 | 四川   |   1 | 中國  | 中國~四川            
  3 | 雲南   |   1 | 中國  | 中國~雲南            
複製代碼
  1. 繼續執行recursive query,直到結果集和working table爲空code

  2. 結束遞歸,將前三個步驟的結果集合並,即獲得最終的WITH RECURSIVE的結果集。

嚴格來說,這個過程實現上是一個迭代的過程而非遞歸,不過RECURSIVE這個關鍵詞是SQL標準委員會定立的,因此PostgreSQL也延用了RECURSIVE這一關鍵詞。

相關文章
相關標籤/搜索