通俗易懂的Redis數據結構基礎教程

Redis有5個基本數據結構，string、list、hash、set和zset。它們是平常開發中使用頻率很是高應用最爲普遍的數據結構，把這5個數據結構都吃透了，你就掌握了Redis應用知識的一半了。javascript

string

首先咱們從string談起。string表示的是一個可變的字節數組，咱們初始化字符串的內容、能夠拿到字符串的長度，能夠獲取string的子串，能夠覆蓋string的子串內容，能夠追加子串。java

Redis的字符串是動態字符串，是能夠修改的字符串，內部結構實現上相似於Java的ArrayList，採用預分配冗餘空間的方式來減小內存的頻繁分配，如圖中所示，內部爲當前字符串實際分配的空間capacity通常要高於實際字符串長度len。當字符串長度小於1M時，擴容都是加倍現有的空間，若是超過1M，擴容時一次只會多擴1M的空間。須要注意的是字符串最大長度爲512M。python

初始化字符串 須要提供「變量名稱」和「變量的內容」程序員

> set ireader beijing.zhangyue.keji.gufen.youxian.gongsi
OK
複製代碼

獲取字符串的內容 提供「變量名稱」數組

> get ireader
"beijing.zhangyue.keji.gufen.youxian.gongsi"
複製代碼

獲取字符串的長度 提供「變量名稱」ruby

> strlen ireader
(integer) 42
複製代碼

獲取子串 提供「變量名稱」以及開始和結束位置[start, end]bash

> getrange ireader 28 34
"youxian"
複製代碼

覆蓋子串 提供「變量名稱」以及開始位置和目標子串微信

> setrange ireader 28 wooxian
(integer) 42  # 返回長度
> get ireader
"beijing.zhangyue.keji.gufen.wooxian.gongsi"
複製代碼

追加子串markdown

> append ireader .hao
(integer) 46 # 返回長度
> get ireader
"beijing.zhangyue.keji.gufen.wooxian.gongsi.hao"
複製代碼

遺憾的是字符串沒有提供字串插入方法和子串刪除方法。數據結構

計數器 若是字符串的內容是一個整數，那麼還能夠將字符串當成計數器來使用。

> set ireader 42
OK
> get ireader
"42"
> incrby ireader 100
(integer) 142
> get ireader
"142"
> decrby ireader 100
(integer) 42
> get ireader
"42"
> incr ireader  # 等價於incrby ireader 1
(integer) 43
> decr ireader  # 等價於decrby ireader 1
(integer) 42
複製代碼

計數器是有範圍的，它不能超過Long.Max，不能低於Long.MIN

> set ireader 9223372036854775807
OK
> incr ireader
(error) ERR increment or decrement would overflow
> set ireader -9223372036854775808
OK
> decr ireader
(error) ERR increment or decrement would overflow
複製代碼

過時和刪除 字符串可使用del指令進行主動刪除，可使用expire指令設置過時時間，到點會自動刪除，這屬於被動刪除。可使用ttl指令獲取字符串的壽命。

> expire ireader 60
(integer) 1  # 1表示設置成功，0表示變量ireader不存在
> ttl ireader
(integer) 50  # 還有50秒的壽命，返回-2表示變量不存在，-1表示沒有設置過時時間
> del ireader
(integer) 1  # 刪除成功返回1
> get ireader
(nil)  # 變量ireader沒有了
複製代碼

list

Redis將列表數據結構命名爲list而不是array，是由於列表的存儲結構用的是鏈表而不是數組，並且鏈表仍是雙向鏈表。由於它是鏈表，因此隨機定位性能較弱，首尾插入刪除性能較優。若是list的列表長度很長，使用時咱們必定要關注鏈表相關操做的時間複雜度。

負下標 鏈表元素的位置使用天然數0,1,2,....n-1表示，還可使用負數-1,-2,...-n來表示，-1表示「倒數第一」，-2表示「倒數第二」，那麼-n就表示第一個元素，對應的下標爲0。

隊列／堆棧 鏈表能夠從表頭和表尾追加和移除元素，結合使用rpush/rpop/lpush/lpop四條指令，能夠將鏈表做爲隊列或堆棧使用，左向右向進行均可以

# 右進左出
> rpush ireader go
(integer) 1
> rpush ireader java python
(integer) 3
> lpop ireader
"go"
> lpop ireader
"java"
> lpop ireader
"python"
# 左進右出
> lpush ireader go java python
(integer) 3
> rpop ireader
"go"
...
# 右進右出
> rpush ireader go java python
(integer) 3
> rpop ireader 
"python"
...
# 左進左出
> lpush ireader go java python
(integer) 3
> lpop ireader
"python"
...
複製代碼

在平常應用中，列表經常使用來做爲異步隊列來使用。

長度使用llen指令獲取鏈表長度

> rpush ireader go java python
(integer) 3
> llen ireader
(integer) 3
複製代碼

隨機讀 可使用lindex指令訪問指定位置的元素，使用lrange指令來獲取鏈表子元素列表，提供start和end下標參數

> rpush ireader go java python
(integer) 3
> lindex ireader 1
"java"
> lrange ireader 0 2
1) "go"
2) "java"
3) "python"
> lrange ireader 0 -1  # -1表示倒數第一
1) "go"
2) "java"
3) "python"
複製代碼

使用lrange獲取所有元素時，須要提供end_index，若是沒有負下標，就須要首先經過llen指令獲取長度，才能夠得出end_index的值，有了負下標，使用-1代替end_index就能夠達到相同的效果。

修改元素 使用lset指令在指定位置修改元素。

> rpush ireader go java python
(integer) 3
> lset ireader 1 javascript
OK
> lrange ireader 0 -1
1) "go"
2) "javascript"
3) "python"
複製代碼

插入元素 使用linsert指令在列表的中間位置插入元素，有經驗的程序員都知道在插入元素時，咱們常常搞不清楚是在指定位置的前面插入仍是後面插入，因此antirez在linsert指令裏增長了方向參數before/after來顯示指示前置和後置插入。不過讓人意想不到的是linsert指令並非經過指定位置來插入，而是經過指定具體的值。這是由於在分佈式環境下，列表的元素老是頻繁變更的，意味着上一時刻計算的元素下標在下一時刻可能就不是你所指望的下標了。

> rpush ireader go java python
(integer) 3
> linsert ireader before java ruby
(integer) 4
> lrange ireader 0 -1
1) "go"
2) "ruby"
3) "java"
4) "python"
複製代碼

到目前位置，我尚未在實際應用中發現插入指定的應用場景。

刪除元素 列表的刪除操做也不是經過指定下標來肯定元素的，你須要指定刪除的最大個數以及元素的值

> rpush ireader go java python
(integer) 3
> lrem ireader 1 java
(integer) 1
> lrange ireader 0 -1
1) "go"
2) "python"
複製代碼

定長列表 在實際應用場景中，咱們有時候會遇到「定長列表」的需求。好比要以走馬燈的形式實時顯示中獎用戶名列表，由於中獎用戶實在太多，能顯示的數量通常不超過100條，那麼這裏就會使用到定長列表。維持定長列表的指令是ltrim，須要提供兩個參數start和end，表示須要保留列表的下標範圍，範圍以外的全部元素都將被移除。

> rpush ireader go java python javascript ruby erlang rust cpp
(integer) 8
> ltrim ireader -3 -1
OK
> lrange ireader 0 -1
1) "erlang"
2) "rust"
3) "cpp"
複製代碼

若是指定參數的end對應的真實下標小於start，其效果等價於del指令，由於這樣的參數表示須要須要保留列表元素的下標範圍爲空。

快速列表

若是再深刻一點，你會發現Redis底層存儲的還不是一個簡單的linkedlist，而是稱之爲快速鏈表quicklist的一個結構。首先在列表元素較少的狀況下會使用一塊連續的內存存儲，這個結構是ziplist，也便是壓縮列表。它將全部的元素緊挨着一塊兒存儲，分配的是一塊連續的內存。當數據量比較多的時候纔會改爲quicklist。由於普通的鏈表須要的附加指針空間太大，會比較浪費空間。好比這個列表裏存的只是int類型的數據，結構上還須要兩個額外的指針prev和next。因此Redis將鏈表和ziplist結合起來組成了quicklist。也就是將多個ziplist使用雙向指針串起來使用。這樣既知足了快速的插入刪除性能，又不會出現太大的空間冗餘。

hash

哈希等價於Java語言的HashMap或者是Python語言的dict，在實現結構上它使用二維結構，第一維是數組，第二維是鏈表，hash的內容key和value存放在鏈表中，數組裏存放的是鏈表的頭指針。經過key查找元素時，先計算key的hashcode，而後用hashcode對數組的長度進行取模定位到鏈表的表頭，再對鏈表進行遍歷獲取到相應的value值，鏈表的做用就是用來將產生了「hash碰撞」的元素串起來。Java語言開發者會感到很是熟悉，由於這樣的結構和HashMap是沒有區別的。哈希的第一維數組的長度也是2^n。

增長元素 可使用hset一次增長一個鍵值對，也可使用hmset一次增長多個鍵值對

> hset ireader go fast
(integer) 1
> hmset ireader java fast python slow
OK
複製代碼

獲取元素 能夠經過hget定位具體key對應的value，能夠經過hmget獲取多個key對應的value，可使用hgetall獲取全部的鍵值對，可使用hkeys和hvals分別獲取全部的key列表和value列表。這些操做和Java語言的Map接口是相似的。

> hmset ireader go fast java fast python slow
OK
> hget ireader go
"fast"
> hmget ireader go python
1) "fast"
2) "slow"
> hgetall ireader
1) "go"
2) "fast"
3) "java"
4) "fast"
5) "python"
6) "slow"
> hkeys ireader
1) "go"
2) "java"
3) "python"
> hvals ireader
1) "fast"
2) "fast"
3) "slow"
複製代碼

刪除元素 可使用hdel刪除指定key，hdel支持同時刪除多個key

> hmset ireader go fast java fast python slow
OK
> hdel ireader go
(integer) 1
> hdel ireader java python
(integer) 2
複製代碼

判斷元素是否存在 一般咱們使用hget得到key對應的value是否爲空就直到對應的元素是否存在了，不過若是value的字符串長度特別大，經過這種方式來判斷元素存在與否就略顯浪費，這時可使用hexists指令。

> hmset ireader go fast java fast python slow
OK
> hexists ireader go
(integer) 1
複製代碼

計數器 hash結構還能夠當成計數器來使用，對於內部的每個key均可以做爲獨立的計數器。若是value值不是整數，調用hincrby指令會出錯。

> hincrby ireader go 1
(integer) 1
> hincrby ireader python 4
(integer) 4
> hincrby ireader java 4
(integer) 4
> hgetall ireader
1) "go"
2) "1"
3) "python"
4) "4"
5) "java"
6) "4"
> hset ireader rust good
(integer) 1
> hincrby ireader rust 1
(error) ERR hash value is not an integer
複製代碼

擴容當hash內部的元素比較擁擠時(hash碰撞比較頻繁)，就須要進行擴容。擴容須要申請新的兩倍大小的數組，而後將全部的鍵值對從新分配到新的數組下標對應的鏈表中(rehash)。若是hash結構很大，好比有上百萬個鍵值對，那麼一次完整rehash的過程就會耗時很長。這對於單線程的Redis裏來講有點壓力山大。因此Redis採用了漸進式rehash的方案。它會同時保留兩個新舊hash結構，在後續的定時任務以及hash結構的讀寫指令中將舊結構的元素逐漸遷移到新的結構中。這樣就能夠避免因擴容致使的線程卡頓現象。

縮容 Redis的hash結構不但有擴容還有縮容，從這一點出發，它要比Java的HashMap要厲害一些，Java的HashMap只有擴容。縮容的原理和擴容是一致的，只不過新的數組大小要比舊數組小一倍。

set

Java程序員都知道HashSet的內部實現使用的是HashMap，只不過全部的value都指向同一個對象。Redis的set結構也是同樣，它的內部也使用hash結構，全部的value都指向同一個內部值。

增長元素 能夠一次增長多個元素

> sadd ireader go java python
(integer) 3
複製代碼

讀取元素 使用smembers列出全部元素，使用scard獲取集合長度，使用srandmember獲取隨機count個元素，若是不提供count參數，默認爲1

> sadd ireader go java python
(integer) 3
> smembers ireader
1) "java"
2) "python"
3) "go"
> scard ireader
(integer) 3
> srandmember ireader
"java"
複製代碼

刪除元素 使用srem刪除一到多個元素，使用spop刪除隨機一個元素

> sadd ireader go java python rust erlang
(integer) 5
> srem ireader go java
(integer) 2
> spop ireader
"erlang"
複製代碼

判斷元素是否存在 使用sismember指令，只能接收單個元素

> sadd ireader go java python rust erlang
(integer) 5
> sismember ireader rust
(integer) 1
> sismember ireader javascript
(integer) 0
複製代碼

sortedset

SortedSet(zset)是Redis提供的一個很是特別的數據結構，一方面它等價於Java的數據結構Map<String, Double>，能夠給每個元素value賦予一個權重score，另外一方面它又相似於TreeSet，內部的元素會按照權重score進行排序，能夠獲得每一個元素的名次，還能夠經過score的範圍來獲取元素的列表。

zset底層實現使用了兩個數據結構，第一個是hash，第二個是跳躍列表，hash的做用就是關聯元素value和權重score，保障元素value的惟一性，能夠經過元素value找到相應的score值。跳躍列表的目的在於給元素value排序，根據score的範圍獲取元素列表。

增長元素 經過zadd指令能夠增長一到多個value/score對，score放在前面

> zadd ireader 4.0 python
(integer) 1
> zadd ireader 4.0 java 1.0 go
(integer) 2
複製代碼

長度經過指令zcard能夠獲得zset的元素個數

> zcard ireader
(integer) 3
複製代碼

刪除元素 經過指令zrem能夠刪除zset中的元素，能夠一次刪除多個

> zrem ireader go python
(integer) 2
複製代碼

計數器 同hash結構同樣，zset也能夠做爲計數器使用。

> zadd ireader 4.0 python 4.0 java 1.0 go
(integer) 3
> zincrby ireader 1.0 python
"5"
複製代碼

獲取排名和分數 經過zscore指令獲取指定元素的權重，經過zrank指令獲取指定元素的正向排名，經過zrevrank指令獲取指定元素的反向排名[倒數第一名]。正向是由小到大，負向是由大到小。

> zscore ireader python
"5"
> zrank ireader go  # 分數低的排名考前，rank值小
(integer) 0
> zrank ireader java
(integer) 1
> zrank ireader python
(integer) 2
> zrevrank ireader python
(integer) 0
複製代碼

根據排名範圍獲取元素列表 經過zrange指令指定排名範圍參數獲取對應的元素列表，攜帶withscores參數能夠一併獲取元素的權重。經過zrevrange指令按負向排名獲取元素列表[倒數]。正向是由小到大，負向是由大到小。

> zrange ireader 0 -1  # 獲取全部元素
1) "go"
2) "java"
3) "python"
> zrange ireader 0 -1 withscores
1) "go"
2) "1"
3) "java"
4) "4"
5) "python"
6) "5"
> zrevrange ireader 0 -1 withscores
1) "python"
2) "5"
3) "java"
4) "4"
5) "go"
6) "1"
複製代碼

根據score範圍獲取列表 經過zrangebyscore指令指定score範圍獲取對應的元素列表。經過zrevrangebyscore指令獲取倒排元素列表。正向是由小到大，負向是由大到小。參數-inf表示負無窮，+inf表示正無窮。

> zrangebyscore ireader 0 5
1) "go"
2) "java"
3) "python"
> zrangebyscore ireader -inf +inf withscores
1) "go"
2) "1"
3) "java"
4) "4"
5) "python"
6) "5"
> zrevrangebyscore ireader +inf -inf withscores  # 注意正負反過來了
1) "python"
2) "5"
3) "java"
4) "4"
5) "go"
6) "1"
複製代碼

根據範圍移除元素列表 能夠經過排名範圍，也能夠經過score範圍來一次性移除多個元素

> zremrangebyrank ireader 0 1
(integer) 2  # 刪掉了2個元素
> zadd ireader 4.0 java 1.0 go
(integer) 2
> zremrangebyscore ireader -inf 4
(integer) 2
> zrange ireader 0 -1
1) "python"
複製代碼

跳躍列表 zset內部的排序功能是經過「跳躍列表」數據結構來實現的，它的結構很是特殊，也比較複雜。這一塊的內容深度讀者要有心理準備。

由於zset要支持隨機的插入和刪除，因此它很差使用數組來表示。咱們先看一個普通的鏈表結構。

咱們須要這個鏈表按照score值進行排序。這意味着當有新元素須要插入時，須要定位到特定位置的插入點，這樣才能夠繼續保證鏈表是有序的。一般咱們會經過二分查找來找到插入點，可是二分查找的對象必須是數組，只有數組才能夠支持快速位置定位，鏈表作不到，那該怎麼辦？

想一想一個創業公司，剛開始只有幾我的，團隊成員之間人人平等，都是聯合創始人。隨着公司的成長，人數漸漸變多，團隊溝通成本隨之增長。這時候就會引入組長制，對團隊進行劃分。每一個團隊會有一個組長。開會的時候分團隊進行，多個組長之間還會有本身的會議安排。公司規模進一步擴展，須要再增長一個層級——部門，每一個部門會從組長列表中推選出一個表明來做爲部長。部長們之間還會有本身的高層會議安排。

跳躍列表就是相似於這種層級制，最下面一層全部的元素都會串起來。而後每隔幾個元素挑選出一個表明來，再將這幾個表明使用另一級指針串起來。而後在這些表明裏再挑出二級表明，再串起來。最終就造成了金字塔結構。

想一想你老家在世界地圖中的位置：亞洲-->中國->安徽省->安慶市->樅陽縣->湯溝鎮->田間村->xxxx號，也是這樣一個相似的結構。

「跳躍列表」之因此「跳躍」，是由於內部的元素可能「身兼數職」，好比上圖中間的這個元素，同時處於L0、L1和L2層，能夠快速在不一樣層次之間進行「跳躍」。

定位插入點時，先在頂層進行定位，而後下潛到下一級定位，一直下潛到最底層找到合適的位置，將新元素插進去。你也許會問那新插入的元素如何纔有機會「身兼數職」呢？

跳躍列表採起一個隨機策略來決定新元素能夠兼職到第幾層，首先L0層確定是100%了，L1層只有50%的機率，L2層只有25%的機率，L3層只有12.5%的機率，一直隨機到最頂層L31層。絕大多數元素都過不了幾層，只有極少數元素能夠深刻到頂層。列表中的元素越多，可以深刻的層次就越深，能進入到頂層的機率就會越大。

這還挺公平的，能不能進入中央不是靠拼爹，而是看運氣。

微信掃一掃關注公衆號「碼洞」，閱讀更多精彩文章