二分搜索樹是爲了快速查找而生,它是一顆二叉樹,每個節點只有一個元素(值或鍵值對),左子樹全部節點的值均小於父節點的值,右子樹全部的值均大於父節點的值,左右子樹也是一顆二分搜索樹,並且沒有鍵值相等的節點。它的查找、插入和刪除的時間複雜度都與樹高成比例,指望值是O(log n)。html
可是插入數組如[],二分搜索樹的缺點就暴露出來了,二分搜索樹退化成線性表,查找的時間複雜度達到最壞時間複雜度O(n)。算法
那有沒有插入和刪除操做都能保持樹的完美平衡性(任何一個節點到其葉子節點的路徑長度都是相等的)?數組
有,B樹。B樹是一種自平衡的樹,根節點到其葉子節點的路徑高度都是同樣的,可以保持數據有序(經過中序遍歷能獲得有序數據)。B樹一個節點能夠擁有2個以上的子樹,如2-3樹、2-3-4樹甚至2-3-4-5-6-7-8樹,它們知足二分搜索樹的性質,但它們不屬於二叉樹,也不屬於二分搜索樹。ide
2-3-4樹的完美平衡,每條從根節點到葉子節點的路徑的高度都是同樣的函數
2-3-4樹有如下節點組成:學習
2-節點,含有一個元素(值或鍵值對)和兩個子樹(左右子樹),左子樹全部的值均小於父節點的值,右子樹全部的值均大於父節點的值;動畫
3-節點,含有兩個元素和三個子樹,左子樹全部的值均小於父節點最小元素的值,中間子樹全部的值均位於父節點兩個元素之間,右子樹全部的值均大於父節點最大元素的值;spa
4-節點,含有三個元素和四個子樹,節點之間的比較也知足二分搜索樹的性質。設計
2-3-4樹的查找相似二分搜索樹的查找。3d
2-3-4樹的插入算法是消除當前節點是4-節點,將4-節點分解成多個2-節點,中間的2-節點與父節點合併成3-節點或4-節點。
沿着連接向下進行變換分解4-節點分爲兩種狀況:
1)4-節點做爲根節點,分解成3個2-節點,中間的2-節點做爲根節點;
2)當前節點爲4-節點,分解成3個2-節點,中間的2-節點與父節點合併成3-節點或4-節點;
圖:沿着連接向下進行變換,分解4-節點
在沿着左右連接向下進行變換的同時,也會進行命中查找。若是元素是鍵值對的話,查找命中將舊的值賦值爲新的值;若是元素是一個值的話,查找命中將忽略之,由於二分搜索樹須要知足沒有相等的元素;若是須要支持重複的元素,則在元素對象添加count屬性,默認爲1。
若是查找未命中,則將待插入元素插入在葉子節點上。樹底下插入一個元素只有兩種狀況:向2-節點中插入和向3-節點中插入。
圖:樹底下插入一個元素
2-3-4樹的刪除算法是消除當前節點是2-節點,向兄弟節點或父節點借一個元素過來。
從根節點的左孩子開始,沿着左連接向下進行變換能夠分爲三種狀況:
1)當前節點不是2-節點,跳過;
2)當前節點是2-節點,兄弟節點是2-節點,將當前節點、父節點最小元素和兄弟節點合併爲4-節點,當前節點變換成4-節點;
3)當前節點是2-節點,兄弟節點不是2-節點,將兄弟節點的最小元素移到父節點,父節點的最小元素移到當前節點,當前節點變換成3-節點。
圖:沿着左連接向下進行變換
從根節點的右孩子開始,沿着右連接向下進行變換也一樣分爲三種狀況:
1)當前節點不是2-節點,跳過;
2)當前節點是2-節點,兄弟節點是2-節點,將當前節點、父節點的最大元素和兄弟節點合併爲4-節點,當前節點變換成4-節點;
3)當前節點是2-節點,兄弟節點不是2-節點,將兄弟節點的最大元素移到父節點,父節點的最大元素移到當前節點,當前節點變換成3-節點。
圖:沿着右連接向下進行變換
學習過刪除最小元素和刪除最大元素算法以後,刪除任意元素的算法天然就簡單了。刪除任意元素算法須要先進行命中查找,若查找命中,則將右子樹的最小值替換掉待刪除元素,而後將右子樹進行刪除最小元素的算法。
2-3-4樹雖知足二分搜索樹的性質,但不是一顆二分搜索樹。若是指望它是一顆二分搜索樹,就須要將3-節點和4-節點替換爲多個2-節點,還須要註明元素之間的關係(用紅連接表示)。
圖:替換3-節點
圖:替換4-節點
可是存在一個問題,2-3-4樹由於3-節點的不一樣表示會有不少種不一樣的紅黑樹,3-節點既能夠左傾,也能夠右傾。因此爲了保證樹的惟一性,3-節點只考慮左傾,固然你也能夠只考慮右傾。
這樣對於任何一顆2-3-4樹,只考慮左傾的狀況下,都能獲得惟一的一顆對應的紅黑樹,這種樹也叫左傾紅黑樹,相對比較減小了複雜性,設計更容易被實現。
紅黑樹的查找算法和二分搜索樹同樣。
關於連接的顏色變換隻跟顏色轉換有關,而旋轉不會改變連接的顏色變換,只在被紅連接指向的節點變成紅色,被黑連接指向的節點變成黑色。
旋轉是將不知足紅黑樹性質的3-節點和4-節點進行旋轉,若是3-節點出現右連接,則將右連接經過左旋轉變成左連接;若是4-節點出現一個紅節點連着兩條紅連接,則將4-節點配平。
圖:左旋轉
圖:右旋轉
圖:3-節點和4-節點的旋轉
顏色轉換隻應用於4-節點。
圖:顏色轉換
回顧以前的2-3-4樹的插入算法,它有兩個過程:沿着連接向下進行分解4-節點和樹底下插入一個元素。
紅黑樹的插入算法和2-3-4樹的插入算法相似,它不只包含前面兩個過程,還增長了向上進行變換的過程,此過程是將3-節點左傾和4-節點配平。
紅黑樹插入算法會先從根節點開始,沿着左右連接向下進行變換,目的是爲了分解4-節點。若是該節點的左右孩子都是紅節點,則經過flipColors方法進行顏色轉換,接着進行下一個子節點;若是不是,則直接進行下一個子節點。
到達樹底的時候,則意味着能夠開始插入新的元素。
若是紅黑樹目前是一顆空樹,插入紅色的元素做爲第一個節點,而後該節點變成黑色。若是不是一顆空樹,插入元素分爲三種狀況:向2-節點插入新元素、向3-節點插入新元素和向4-節點插入新元素。
向2-節點插入新元素很簡單,若是新元素的值小於父節點,直接插入紅色的節點便可;若是新元素的值大於父節點,則產生一個紅色右連接,插完以後則將3-節點進行左旋轉,將右連接變成左連接,被紅連接指向的節點變成紅色,被黑連接指向的節點變成黑色。
圖:向2-節點插入新元素
由於前面的3-節點進行過旋轉,此時的3-節點確定知足左傾紅黑樹的性質。向3-節點插入新元素分爲三種狀況:
1)新元素的值位於3-節點中的兩元素之間;
2)新元素的值小於3-節點中的最小元素;
3)新元素的值大於3-節點中的最大元素。
圖:向3-節點插入新元素
向4-節點插入新元素以前須要先進行顏色轉換,才能夠進行插入新的元素。
圖:向4-節點插入新元素
插完新元素以後須要知足紅黑樹的性質,則在沿着父節點的連接向上進行變換,具體作法和向3-節點插入新元素的作法相似,經過左旋轉將3-節點左傾和左右旋轉將4-節點配平,沒有顏色轉換。
Code:紅黑樹插入算法
紅黑樹刪除算法也須要進行旋轉和顏色轉換操做,在插入算法中爲了待插入元素所在的節點不是4-節點,因此在沿着左右連接向下進行變換時將4-節點分解成3個2-節點,中間的2-節點與父節點合併;而在刪除算法中爲了待刪除元素所在的節點不是2-節點,因此在沿着左右連接向下進行變換時將2-節點向其它不是2-節點的節點(兄弟節點或父節點)借一個元素過來,合併成3-節點。
因此,只要是2-節點的節點,若是兄弟節點不是2-節點,就將兄弟節點的與父節點鄰近的元素移到父節點,而父節點將與當前節點鄰近的元素移到當前節點;若是兄弟節點是2-節點,則將父節點的與當前節點鄰近的元素移到當前節點。(是否是很繞?待會在後面刪除最值算法中詳細給出)
而後刪除完一個元素以後須要進行修復調整,將這個樹知足紅黑樹的性質。若是右連接是紅色,將右連接經過左旋轉變成左連接;若是有連續的左連接,經過右旋轉配平,而後進行顏色轉換。
刪除最小元素算法和二分搜索樹同樣,一直遞歸它的左孩子,直到它的左孩子爲空才進行刪除這個最小元素。可是紅黑樹在遞歸的同時如何旋轉和顏色轉換是個問題。
刪除最小元素算法一直沿着左連接向下進行轉換,對照2-3-4樹,咱們能夠給出三種狀況,從根節點開始:
1)當前節點(父節點位置)的左子節點不是2-節點,直接進行下一個節點(左子節點);
2)當前節點的左子節點和右子節點都是2-節點,則將左子節點、當前節點的最小元素和右子節點合併成4-節點,而後進行下一個節點;
3)當前節點的左子節點是2-節點,右子節點不是2-節點,則將右子節點的最小元素移到當前節點的位置,當前節點的最小元素移到左子節點,而後進行下一個節點。
圖:沿着左連接向下進行轉換
直到某元素左孩子爲空的時候,此時的元素是這個樹的最小元素。由於經過前面的轉換,最小元素確定被一個紅連接指向,刪除這個元素以後經過balance方法修復調整爲紅黑樹。
Code:刪除最小元素算法
刪除最大元素算法和刪除最小元素算法相似的,也分爲三種狀況:
1)當前節點(父節點位置)的右子節點不是2-節點,直接進行下一個節點(右子節點);
2)當前節點的右子節點和左子節點都是2-節點,則將右子節點、當前節點的最大元素和左子節點合併成4-節點,而後進行下一個節點;
3)當前節點的右子節點是2-節點,左子節點不是2-節點,則將左子節點的最大元素移到當前節點的位置,當前節點的最大元素移到左子節點,而後進行下一個節點。
圖:沿着右連接向下進行變換
學習過前面的刪除最小元素算法和刪除最大元素算法,刪除任意元素會變得很簡單。刪除最小元素算法會一直沿着左連接向下進行變換,刪除最大元素算法會一直沿着右連接向下進行變換,而刪除任意元素算法須要同時存在着左右連接向下進行變換。
刪除任意元素算法須要先進行命中查找,在命中查找的過程當中會進行沿着左右連接向下變換,若是查找命中則將右子樹的最小元素替換掉待刪除元素,而後進行右子樹的刪除最小元素算法;若是查找未命中,則直接返回balance函數,向上將3-節點左傾或將4-節點配平。
學習完上面的算法以後,能夠總結下紅黑樹的性質:
1)每一個節點或是紅色的,或是黑色的;
2)根節點是黑色的;
3)每一個葉子節點(NIL)是黑色的;
4)若是一個節點是紅色的,則它的兩個子節點都是黑色的(NIL節點也是黑色的);
5)對每一個結點,從該節點到其全部後代葉子節點的簡單路徑上,均包含相同數目的黑色節點(黑連接平衡)。
喜歡本文的朋友,歡迎關注公衆號「算法無遺策」,收看更多精彩內容