算法詳解之最近公共祖先(LCA)

若圖片出鍋請轉至here

概念

首先是最近公共祖先的概念(什麼是最近公共祖先?):html

在一棵沒有環的樹上,每一個節點確定有其父親節點和祖先節點,而最近公共祖先,就是兩個節點在這棵樹上深度最大的公共的祖先節點。算法

換句話說,就是兩個點在這棵樹上距離最近的公共祖先節點。數組

因此LCA主要是用來處理當兩個點僅有惟一一條肯定的最短路徑時的路徑。函數

有人可能會問:那他自己或者其父親節點是否能夠做爲祖先節點呢?優化

答案是確定的,很簡單,按照人的親戚觀念來講,你的父親也是你的祖先,而LCA還能夠將本身視爲祖先節點。ui

舉個例子吧,以下圖所示4和5的最近公共祖先是2,5和3的最近公共祖先是1,2和1的最近公共祖先是1。 spa

404

這就是最近公共祖先的基本概念了,那麼咱們該如何去求這個最近公共祖先呢?code

一般初學者都會想到最簡單粗暴的一個辦法:對於每一個詢問,遍歷全部的點,時間複雜度爲\(O(n*q)\) ,很明顯,n和q通常不會很小。htm

怎麼辦辦?blog

LCA其實有不少種解法,這裏介紹一個

Tarjan大法好!

什麼是Tarjan(離線)算法呢?顧名思義,就是在一次遍歷中把全部詢問一次性解決,因此其時間複雜度是\(O(n+q)\)

Tarjan算法的優勢在於相對穩定,時間複雜度也比較居中,也很容易理解。

下面詳細介紹一下Tarjan算法的基本思路:

  1. 任選一個點爲根節點,從根節點開始。

  2. 遍歷該點u全部子節點v,並標記這些子節點v已被訪問過。

  3. 如果v還有子節點,返回2,不然下一步。

  4. 合併v到u上。

  5. 尋找與當前點u有詢問關係的點v。

  6. 如果v已經被訪問過了,則能夠確認u和v的最近公共祖先爲v被合併到的父親節點a。

遍歷的話須要用到dfs來遍歷(相信來看的人都懂吧...),至於合併,最優化的方式就是利用並查集來合併兩個節點。

  • 僞代碼
Tarjan(u)//marge和find爲並查集合並函數和查找函數
{
    for each(u,v)    //訪問全部u子節點v
    {
        Tarjan(v);        //繼續往下遍歷
        marge(u,v);    //合併v到u上
        標記v被訪問過;
    }
    for each(u,e)    //訪問全部和u有詢問關係的e
    {
        若是e被訪問過;
        u,e的最近公共祖先爲find(e);
    }
}

我的感受這樣仍是有不少人不太理解,因此打算模擬一遍給你們看。

假設咱們有一組數據 9個節點 8條邊 聯通狀況以下:

1--2,1--3,2--4,2--5,3--6,5--7,5--8,7--9 即下圖所示的樹

設咱們要查找最近公共祖先的點爲9--8,4--6,7--5,5--3;

f[]數組爲並查集的父親節點數組,初始化f[i]=ivis[]數組爲是否訪問過的數組,初始爲0; 

404

下面開始模擬過程

取1爲根節點往下搜索發現有兩個兒子2和3;

先搜2,發現2有兩個兒子4和5,先搜索4,發現4沒有子節點,則尋找與其有關係的點;

發現6與4有關係,可是vis[6]=0,即6還沒被搜過,因此不操做

發現沒有和4有詢問關係的點了,返回此前一次搜索,更新vis[4]=1

404

表示4已經被搜完,更新f[4]=2,繼續搜5,發現5有兩個兒子7和8;

先搜7,發現7有一個子節點9,搜索9,發現沒有子節點,尋找與其有關係的點

發現8和9有關係,可是vis[8]=0,即8沒被搜到過,因此不操做

發現沒有和9有詢問關係的點了,返回此前一次搜索,更新vis[9]=1;

表示9已經被搜完,更新f[9]=7,發現7沒有沒被搜過的子節點了,尋找與其有關係的點;

發現5和7有關係,可是vis[5]=0,因此不操做

發現沒有和7有關係的點了,返回此前一次搜索,更新vis[7]=1

404

表示7已經被搜完,更新f[7]=5,繼續搜8,發現8沒有子節點,則尋找與其有關係的點;

發現9與8有關係,此時vis[9]=1,則他們的最近公共祖先find(9)=5

(find(9)的順序爲f[9]=7-->f[7]=5-->f[5]=5 return 5;)

發現沒有與8有關係的點了,返回此前一次搜索,更新vis[8]=1

表示8已經被搜完,更新f[8]=5,發現5沒有沒搜過的子節點了,尋找與其有關係的點;

404

發現7和5有關係,此時vis[7]=1,因此他們的最近公共祖先find(7)=5

(find(7)的順序爲f[7]=5-->f[5]=5 return 5;)

又發現5和3有關係,可是vis[3]=0,因此不操做,此時5的子節點所有搜完了;

返回此前一次搜索,更新vis[5]=1,表示5已經被搜完,更新f[5]=2

發現2沒有未被搜完的子節點,尋找與其有關係的點;

又發現沒有和2有關係的點,則此前一次搜索,更新vis[2]=1

404

表示2已經被搜完,更新f[2]=1,繼續搜3,發現3有一個子節點6;

搜索6,發現6沒有子節點,則尋找與6有關係的點,發現4和6有關係

此時vis[4]=1,因此它們的最近公共祖先find(4)=1;

(find(4)的順序爲f[4]=2-->f[2]=2-->f[1]=1 return 1;)

發現沒有與6有關係的點了,返回此前一次搜索,更新vis[6]=1,表示6已經被搜完了;

404

更新f[6]=3,發現3沒有沒被搜過的子節點了,則尋找與3有關係的點;

發現5和3有關係,此時vis[5]=1,則它們的最近公共祖先find(5)=1

(find(5)的順序爲f[5]=2-->f[2]=1-->f[1]=1 return 1;)

發現沒有和3有關係的點了,返回此前一次搜索,更新vis[3]=

404

更新f[3]=1,發現1沒有被搜過的子節點也沒有有關係的點,此時能夠退出整個dfs了。

通過此次dfs咱們得出了全部的答案,有沒有以爲很神奇呢?是否對Tarjan算法有更深層次的理解了呢?

參考博文:http://www.javashuo.com/article/p-foyfvsxv-em.html

相關文章
相關標籤/搜索