Redis中有序集合與列表佔用內存分析

時間 2019-11-16

標籤 redis 有序集合列表佔用內存分析欄目 Redis 简体版

原文原文鏈接

在說正題以前須要先了解幾種定義：字典、壓縮列表與跳躍表。
redis

字典：很是常見的數據結構，key-value結構。數組

常見的實現有紅黑樹（stl中的map），哈希表（stl中的unordered_map）。紅黑樹的查找操做具備O（logN）的時間複雜度。哈希表的查找操做具備O(1)的時間複雜度。 redis中的字典使用哈希表做爲底層實現。數據結構

壓縮列表：由一些列特殊編碼的連續內存塊組成的順序型數據結構。編碼

壓縮列表能夠包含多種節點（只能保存一種的那叫數組）。壓縮列表的優勢是節省內存。順序結構擁有的缺點壓縮列表全都有。spa

跳躍表：一種有序數據結構，它經過在每一個節點中維護多個指向其餘節點的指針，從而達到快速訪問節點的目的。指針

跳躍表支持平均O（logN）、最壞O（N）時間複雜度的節點查找。對象

redis中的跳躍表由zskiplist和zskiplistNode兩個結構組成，其中zskiplist用於保存跳躍表的信息（好比表頭節點、表尾節點、長度），而zskiplistNode用於表示跳躍表節點。跳躍表中的節點按照分支大小進行排序，當分值相同時，節點按照成員對象的大小進行排序。在同一跳躍表中，多個節點能夠包含相同的分值，但每節點的成員對象必須是惟一的。排序

進入正題，爲何redis中的有序集合佔用內存比列表大？ip

先說redis中的列表的實現，redis中的列表底層使用壓縮列表或鏈表來實現。redis列表有兩種不一樣的編碼（實現方式）：ziplist和linkedlist。在特定的條件下，編碼格式能夠進行相互轉換。當列表對象保存的全部字符串元素的長度都小於64字節，而且列表對象的元素數量小於512時，列表對象使用ziplist。反之，使用linkedlist編碼。內存

重點說一下有序集合的實現，redis中有序集合的實現要更加複雜，包含ziplist和skiplist兩種不一樣編碼。

ziplist編碼的有序集合對象使用壓縮列表做爲底層實現。每一個集合元素使用兩個緊挨在一塊兒的壓縮列表節點來保存，第一個節點保存元素的成員（member），而第二個元素則保存元素的分值（score）。

skiplist編碼的有序集合對象使用zset結果做爲底層實現，一個zset結構同時包含一個字典和一個跳躍表。zset結構中的跳躍表按照分值從小到大保存了全部的集合元素，經過這個跳躍表，能夠有序結合進行範圍型操做，例如zrank、zrange。 zset結構中的字典保存了有序集合中成員到分值的映射，經過這個字典，能夠用O(1)的時間複雜度查找成員的分值。雖然zset使用兩種數據結構來保存數據，但這兩種數據結構使用指針來共享相同元素的成員和分值，因此並不會產生任何重複的成員或者分值。

當有序集合保存的元素數量小於128個，而且全部元素成員的長度小於64字節時，使用ziplist編碼。反之，使用skiplist編碼。

爲何有序集合要同時使用跳躍表和字典來實現呢？

單獨使用字典時，查找快，只須要O(1)的時間複雜度，可是範圍操做就須要對字典元素進行排序，完成這種排序至少須要O(NlogN)的時間複雜度，以及額外的O(N)的內存空間。

單獨使用跳躍表時，跳躍表執行範圍操做的優勢會被保留，可是查找的效率會降低，查找的時間複雜度會從O(1)上升到O(logN)。

經過以上的分析能夠看到，列表對象的實現相比有序集合對象的實現要簡單的多，沒有那麼多亂七八糟的事情。因此，有序集合會比列表佔用更多的內存。