1、問題引入php
原題:杭電hdu1232暢通工程 html
題意:首先在地圖上給你若干個城鎮,這些城鎮均可以看做點,而後告訴你哪些對城鎮之間是有道路直接相連的。最後要解決的是整幅圖的連通性問題。好比隨意給你兩個點,讓你判斷它們是否連通,或者問你整幅圖一共有幾個連通分支,也就是被分紅了幾個互相獨立的塊。像暢通工程這題,問還須要修幾條路,實質就是求有幾個連通分支。若是是1個連通分支,說明整幅圖上的點都連起來了,不用再修路了;若是是2個連通分支,則只要再修1條路,從兩個分支中各選一個點,把它們連起來,那麼全部的點都是連起來的了;若是是3個連通分支,則只要再修兩條路……算法
說明:輸入4 2 1 3 4 3。即一共有4個點,2條路。下面兩行告訴你,一、3之間有條路,四、3之間有條路。那麼整幅圖就被分紅了1-3-4和2兩部分。只要再加一條路,把2和其餘任意一個點連起來,暢通工程就實現了,那麼這個這組數據的輸出結果就是1。好了,如今編程實現這個功能吧,城鎮有幾百個,路有不知道多少條,並且可能有迴路。 這可如何是好? 我之前也不會呀,自從用了並查集以後,嗨,效果還真好!編程
2、故事描述數組
並查集由一個整數型的數組和兩個函數構成。數組pre[]記錄了每一個點的前導點是什麼,函數find是查找,函數join是合併。函數
話說江湖上散落着各式各樣的大俠,有上千個之多。他們沒有什麼正當職業,成天揹着劍在外面走來走去,碰到和本身不是一路人的,就免不了要打一架。但大俠們有一個優勢就是講義氣,絕對不打本身的朋友。並且他們信奉「朋友的朋友就是個人朋友」,只要是能經過朋友關係串聯起來的,無論拐了多少個彎,都認爲是本身人。這樣一來,江湖上就造成了一個一個的羣落,經過兩兩之間的朋友關係串聯起來。而不在同一個羣落的人,不管如何都沒法經過朋友關係連起來,因而就能夠放心往死了打。可是兩個本來互不相識的人,如何判斷是否屬於一個朋友圈呢? 咱們能夠在每一個朋友圈內推舉出一個比較有名望的人,做爲該圈子的表明人物,這樣,每一個圈子就能夠這樣命名「齊達內朋友之隊」「羅納爾多朋友之隊」……兩人只要互相對一下本身的隊長是否是同一我的,就能夠肯定敵友關係了。 可是還有問題啊,大俠們只知道本身直接的朋友是誰,不少人壓根就不認識隊長,要判斷本身的隊長是誰,只能漫無目的的經過朋友的朋友關係問下去:「你是否是隊長?你是否是隊長?」 這樣一來,隊長面子上掛不住了,並且效率過低,還有可能陷入無限循環中。因而隊長下令,從新組隊。隊內全部人實行分等級制度,造成樹狀結構,我隊長就是根節點,下面分別是二級隊員、三級隊員。每一個人只要記住本身的上級是誰就好了。遇到判斷敵友的時候,只要一層層向上問,直到最高層,就能夠在短期內肯定隊長是誰了。因爲咱們關心的只是兩我的之間是否連通,至於他們是如何連通的,以及每一個圈子內部的結構是怎樣的,甚至隊長是誰,並不重要。因此咱們能夠聽任隊長隨意從新組隊,只要不搞錯敵友關係就行了。因而,門派產生了。 優化
下面咱們來看並查集的實現。 int pre[1000]; 這個數組,記錄了每一個大俠的上級是誰。大俠們從1或者0開始編號(依據題意而定),pre[15]=3就表示15號大俠的上級是3號大俠。若是一我的的上級就是他本身,那說明他就是掌門人了,查找到此爲止。也有孤家寡人自成一派的,好比歐陽鋒,那麼他的上級就是他本身。每一個人都只認本身的上級。好比胡青牛同窗只知道本身的上級是楊左使。張無忌是誰?不認識!要想知道本身的掌門是誰,只能一級級查上去。 find這個函數就是找掌門用的,意義再清楚不過了(路徑壓縮算法先不論,後面再說)。spa
int find(int x) //查找x的掌門 { int r=x; //委託 r 去找掌門 while(pre[r] != r) //若是r的上級不是r本身(也就是說找到的大俠他不是掌門 = =) r = pre[r] ; // r 接着找他的上級,直到找到掌門爲止。 return r ; //掌門駕到~~~ }
再來看看join函數,就是在兩個點之間連一條線,這樣一來,原先它們所在的兩個板塊的全部點就均可以互通了。這在圖上很好辦,畫條線就好了。但咱們如今是用並查集來描述武林中的情況的,一共只有一個pre[]數組,該如何實現呢? 仍是舉江湖的例子,假設如今武林中的形勢如圖所示。虛竹小和尚與周芷若MM是我很是喜歡的兩我的物,他們的終極boss分別是玄慈方丈和滅絕師太,那明顯就是兩個陣營了。我不但願他們互相打架,就對他倆說:「大家兩位拉拉勾,作好朋友吧。」他們看在個人面子上,贊成了。這一讚成可非同小可,整個少林和峨眉派的人就不能打架了。這麼重大的變化,可如何實現呀,要改動多少地方?其實很是簡單,我對玄慈方丈說:「大師,麻煩你把你的上級改成滅絕師太吧。這樣一來,兩派原先的全部人員的終極boss都是師太,那還打個球啊!反正咱們關心的只是連通性,門派內部的結構沒關係的。」玄慈一聽確定火大了:「我靠,憑什麼是我變成她手下呀,怎麼不反過來?我抗議!」抗議無效,上天安排的,最大。反正誰加入誰效果是同樣的,我就隨手指定了一個。這段函數的意思很明白了吧? 指針
void join(int x,int y) //我想讓虛竹和周芷若作朋友 { int fx=find(x), fy=find(y); //虛竹的老大是玄慈,芷若MM的老大是滅絕 if(fx != fy) //玄慈和滅絕顯然不是同一我的 pre[fx]=fy; //方丈只好委委屈屈地當了師太的手下啦 }
再來看看路徑壓縮算法。創建門派的過程是用join函數兩我的兩我的地鏈接起來的,誰當誰的手下徹底隨機。最後的樹狀結構會變成什麼樣,我也徹底沒法預計,一字長蛇陣也有可能。這樣查找的效率就會比較低下。最理想的狀況就是全部人的直接上級都是掌門,一共就兩級結構,只要找一次就找到掌門了。哪怕不能徹底作到,也最好儘可能接近。這樣就產生了路徑壓縮算法。 設想這樣一個場景:兩個互不相識的大俠碰面了,想知道能不能揍。 因而趕忙打電話問本身的上級:「你是否是掌門?」 上級說:「我不是呀,個人上級是誰誰誰,你問問他看看。」 一路問下去,原來兩人的最終boss都是東廠曹公公。 「哎呀呀,原來是記己人,西禮西禮,在下三營六組白麪葫蘆娃!」 「幸會幸會,在下九營十八組仙子狗尾巴花!」 兩人高高興興地手拉手喝酒去了。 「等等等等,兩位同窗請留步,還有事情沒完成呢!」我叫住他倆。 「哦,對了,還要作路徑壓縮。」兩人醒悟。 白麪葫蘆娃打電話給他的上級六組長:「組長啊,我查過了,其習偶們的掌門是曹公公。不如偶們一塊兒直接拜在曹公公手下吧,免得級別過低,之後查找掌門麻環。」 「唔,有道理。」 白麪葫蘆娃接着打電話給剛纔拜訪過的三營長……仙子狗尾巴花也作了一樣的事情。 這樣,查詢中全部涉及到的人物都彙集在曹公公的直接領導下。每次查詢都作了優化處理,因此整個門派樹的層數都會維持在比較低的水平上。路徑壓縮的代碼,看得懂很好,看不懂也不要緊,直接抄上用就好了。總之它所實現的功能就是這麼個意思。code
3、算法描述
關鍵特徵:
①用集合中的某個元素來表明這個集合,該元素稱爲集合的表明元
;
②一個集合內的全部元素組織成以表明元爲根的樹形結構;
③對於每個元素 pre[x]指向x在樹形結構上的父親節點。若是x是根節點,則令pre[x] = x;
④對於查找操做,假設須要肯定x所在的的集合,也就是肯定集合的表明元。能夠沿着pre[x]不斷在樹形結構中向上移動,直到到達根節點。
判斷兩個元素是否屬於同一集合,只須要看他們的表明元是否相同便可。
路徑壓縮:
爲了加快查找速度,查找時將x到根節點路徑上的全部點的pre(上級)設爲根節點,該優化方法稱爲壓縮路徑。使用該優化後,平均複雜度可視爲Ackerman函數的反函數,實際應用中可粗略認爲其是一個常數。
用途:
一、維護無向圖的連通性。支持判斷兩個點是否在同一連通塊內,和判斷增長一條邊是否會產生環。
二、用在求解最小生成樹的Kruskal算法裏。
通常來講,一個並查集對應三個操做:初始化+查找根結點函數+合併集合函數
【初始化】
包括對全部單個的數據創建一個單獨的集合(即根據題目的意思本身創建的最多可能有的集合,爲下面的合併查找操做提供操做對象)。
在每個單個的集合裏面,有三個東西。
①集合所表明的數據(這個初始值根據須要本身定義,不固定) ;
②這個集合的層次一般用rank表示(通常來講,初始化的工做之一就是將每個集合裏的rank置爲1);
③這個集合的類別pre(其實就是一個指針,用來指示這個集合屬於那一類,合併事後的集合,他們的pre指向的最終值必定是相同的) (有的簡單題裏面集合的數據就是這個集合的標號,也就是說只包含2和3,1省略了)。
初始化的時候,每個集合的pre都是這個集合本身的標號。沒有跟它同類的集合,那麼這個集合的源頭只能是本身了。
最簡單的集合就只含有這三個東西了,固然,複雜的集合就是把3指針這一項添加內容,如PKU食物鏈那題,咱們還能夠添加enemy指針,表示這個物種集合的天敵集合;food指針,表示這個物種集合的食物集合。隨着指針的增長,並查集操做起來也變得複雜,題目也就顯得更難了。
數組表示法
設置不少相同大小的數組,如:
int pre[max]; //集合index的類別,或者用parent表示 int rank[max]; //集合index的層次,一般初始化爲0 int data[max]; //集合index的數據類型 //初始化集合 void Make_pre(int i) { pre[i]=i; //一個集合的pre都是這個集合本身的標號。沒有跟它同類的集合,那麼這個集合的源頭只能是本身了。 rank[i]=0; }
【查找函數】
就是找到pre指針的源頭,能夠把函數命名爲find_pre,若是集合的pre等於集合的編號(即尚未被合併或者沒有同類),那麼天然返回自身編號。 若是不一樣(即通過合併操做後指針指向了源頭(合併後選出的rank高的集合))那麼就能夠調用遞歸函數,以下面的代碼:
//查找集合i(一個元素是一個集合)的源頭(遞歸實現) int Find_pre(int i) { //若是集合i的父親是本身,說明本身就是源頭,返回本身的標號 if(pre[i]==i) return pre[i]; //不然查找集合i的父親的源頭 return Find_pre(pre[i]); }
【合併集合函數】
這就是所謂並查集的並了。至於怎麼知道兩個集合是能夠合併的,那就是題目的條件了。先看代碼:
void Union(int i,int j) { i=Find_pre(i); j=Find_pre(j); if(i==j) return ; if(rank[i]>rank[j]) pre[j]=i; else { if(rank[i]==rank[j]) rank[j]++; pre[i]=j; } }
4、代碼實現
#define N 105 int pre[N]; //每一個結點 int rank[N]; //樹的高度 //初始化 int init(int n) //對n個結點初始化 { for(int i = 0; i < n; i++){ pre[i] = i; //每一個結點的上級都是本身 rank[i] = 1; //每一個結點構成的樹的高度爲1 } } int find_pre(int x) //查找結點x的根結點 { if(pre[x] == x){ //遞歸出口:x的上級爲x自己,即x爲根結點 return x; } return find_pre(pre[x]); //遞歸查找 } //改進查找算法:完成路徑壓縮,將x的上級直接變爲根結點,那麼樹的高度就會大大下降 int find_pre(int x) //查找結點x的根結點 { if(pre[x] == x){ //遞歸出口:x的上級爲x自己,即x爲根結點 return x; } return pre[x] = find_pre(pre[x]); //遞歸查找 此代碼至關於 先找到根結點rootx,而後pre[x]=rootx } bool is_same(int x, int y) //判斷兩個結點是否連通 { return find_pre(x) == find_pre(y); //判斷兩個結點的根結點(亦稱表明元)是否相同 } void unite(int x,int y) { int rootx, rooty; rootx = find_pre(x); rooty = find_pre(y); if(rootx == rooty){ return ; } if(rank(rootx) > rank(rooty)){ pre[rooty] = rootx; //令y的根結點的上級爲rootx } else{ if(rank(rootx) == rank(rooty)){ rank(rooty)++; } pre[rootx] = rooty; } }
後記:寫到這裏,並查集只是入了門,還有一些知識點在下篇文章——並查集(進階)中講解。