圖解Redis之數據結構篇——跳躍表

時間 2019-11-07

標籤圖解 redis 數據結構跳躍欄目 Redis 简体版

原文原文鏈接

文章導航-readme

前言

跳躍表是一種有序的數據結構，它經過在每一個節點中維持多個指向其餘節點的指針，從而達到快速訪問節點的目的。這麼說，咱們可能很難理解，咱們能夠先回憶一下鏈表。html

1、複習跳躍表

1.1 什麼是跳躍表

對於一個單鏈表來說，即使鏈表中存儲的數據是有序的，若是咱們要想在其中查找某個數據，也只能從頭至尾遍歷鏈表。這樣查找效率就會很低，時間複雜度會很高，是 O(n)。node

若是咱們想要提升其查找效率，能夠考慮在鏈表上建索引的方式。每兩個結點提取一個結點到上一級，咱們把抽出來的那一級叫做索引。 redis

這個時候，咱們假設要查找節點8，咱們能夠先在索引層遍歷，當遍歷到索引層中值爲 7 的結點時，發現下一個節點是9，那麼要查找的節點8確定就在這兩個節點之間。咱們降低到鏈表層繼續遍歷就找到了8這個節點。原先咱們在單鏈表中找到8這個節點要遍歷8個節點，而如今有了一級索引後只須要遍歷五個節點。數組

從這個例子裏，咱們看出，加來一層索引以後，查找一個結點須要遍的結點個數減小了，也就是說查找效率提升了，同理再加一級索引。數據結構

從圖中咱們能夠看出，查找效率又有提高。在例子中咱們的數據不多，當有大量的數據時，咱們能夠增長多級索引，其查找效率能夠獲得明顯提高。運維

像這種鏈表加多級索引的結構，就是跳躍表！設計

2、Redis跳躍表

Redis使用跳躍表做爲有序集合鍵的底層實現之一,若是一個有序集合包含的元素數量比較多,又或者有序集合中元素的成員是比較長的字符串時, Redis就會使用跳躍表來做爲有序集合健的底層實現。指針

這裏咱們須要思考一個問題——爲何元素數量比較多或者成員是比較長的字符串的時候Redis要使用跳躍表來實現？htm

從上面咱們能夠知道，跳躍表在鏈表的基礎上增長了多級索引以提高查找的效率，但其是一個空間換時間的方案，必然會帶來一個問題——索引是佔內存的。原始鏈表中存儲的有多是很大的對象，而索引結點只須要存儲關鍵值值和幾個指針，並不須要存儲對象，所以當節點自己比較大或者元素數量比較多的時候，其優點必然會被放大，而缺點則能夠忽略。對象

2.1 Redis中跳躍表的實現

Redis的跳躍表由zskiplistNode和skiplist兩個結構定義,其中 zskiplistNode結構用於表示跳躍表節點,而 zskiplist結構則用於保存跳躍表節點的相關信息,好比節點的數量,以及指向表頭節點和表尾節點的指針等等。

上圖展現了一個跳躍表示例,其中最左邊的是 skiplist結構,該結構包含如下屬性。

header:指向跳躍表的表頭節點，經過這個指針程序定位表頭節點的時間複雜度就爲O(1)
tail:指向跳躍表的表尾節點,經過這個指針程序定位表尾節點的時間複雜度就爲O(1)
level:記錄目前跳躍表內,層數最大的那個節點的層數(表頭節點的層數不計算在內)，經過這個屬性能夠再O(1)的時間複雜度內獲取層高最好的節點的層數。
length:記錄跳躍表的長度,也便是,跳躍表目前包含節點的數量(表頭節點不計算在內)，經過這個屬性，程序能夠再O(1)的時間複雜度內返回跳躍表的長度。

結構右方的是四個 zskiplistNode結構,該結構包含如下屬性
層(level):

    節點中用一、二、L3等字樣標記節點的各個層,L1表明第一層,L表明第二層,以此類推。

    每一個層都帶有兩個屬性:前進指針和跨度。前進指針用於訪問位於表尾方向的其餘節點,而跨度則記錄了前進指針所指向節點和當前節點的距離(跨度越大、距離越遠)。在上圖中,連線上帶有數字的箭頭就表明前進指針,而那個數字就是跨度。當程序從表頭向表尾進行遍歷時,訪問會沿着層的前進指針進行。

    每次建立一個新跳躍表節點的時候,程序都根據冪次定律(powerlaw,越大的數出現的機率越小)隨機生成一個介於1和32之間的值做爲level數組的大小,這個大小就是層的「高度」。
後退(backward)指針：

節點中用BW字樣標記節點的後退指針,它指向位於當前節點的前一個節點。後退指針在程序從表尾向表頭遍歷時使用。與前進指針所不一樣的是每一個節點只有一個後退指針，所以每次只能後退一個節點。
分值(score):

各個節點中的1.0、2.0和3.0是節點所保存的分值。在跳躍表中,節點按各自所保存的分值從小到大排列。
成員對象(oj):

各個節點中的o一、o2和o3是節點所保存的成員對象。在同一個跳躍表中,各個節點保存的成員對象必須是惟一的,可是多個節點保存的分值卻能夠是相同的:分值相同的節點將按照成員對象在字典序中的大小來進行排序,成員對象較小的節點會排在前面(靠近表頭的方向),而成員對象較大的節點則會排在後面(靠近表尾的方向)。

2.2 Redis跳躍表經常使用操做的時間複雜度

操做	時間複雜度
建立一個跳躍表	O(1)
釋放給定跳躍表以及其中包含的節點	O(N)
添加給定成員和分值的新節點	平均O(logN),最壞O(logN)(N爲跳躍表的長度)
刪除除跳躍表中包含給定成員和分值的節點	平均O(logN),最壞O(logN)(N爲跳躍表的長度)
返回給定成員和分值的節點再表中的排位	平均O(logN),最壞O(logN)(N爲跳躍表的長度)
返回在給定排位上的節點	平均O(logN),最壞O(logN)(N爲跳躍表的長度)
給定一個分值範圍,返回跳躍表中第一個符合這個範圍的節點	O(1)
給定一個分值範圍,返回跳躍表中最後一個符合這個範圍的節點	平均O(logN),最壞O(logN)(N爲跳躍表的長度)
給定一個分值範圍,除跳躍表中全部在這個範圍以內的節點	平均O(logN),最壞O(logN)(N爲跳躍表的長度)
給定一個排位範圍,鼎除跳躍表中全部在這個範圍以內的節點	O(N),N爲被除節點數量
給定一個分值範固(range),好比0到15,20到28,諸如此類,若是跳氏表中有至少一個節點的分值在這個範間以內,那麼返回1,不然返回0	O(N),N爲被除節點數量

本文重點

跳躍表基於單鏈表加索引的方式實現
跳躍表以空間換時間的方式提高了查找速度
Redis有序集合在節點元素較大或者元素數量較多時使用跳躍表實現
Redis的跳躍表實現由 zskiplist和 zskiplistnode兩個結構組成,其中 zskiplist用於保存跳躍表信息(好比表頭節點、表尾節點、長度),而zskiplistnode則用於表示跳躍表節點
Redis每一個跳躍表節點的層高都是1至32之間的隨機數
在同一個跳躍表中,多個節點能夠包含相同的分值,但每一個節點的成員對象必須是惟一的跳躍表中的節點按照分值大小進行排序,當分值相同時,節點按照成員對象的大小進行排序。