當redis被用做緩存時,有時咱們但願瞭解key的大小分佈,或者想知道哪些key佔的空間比較大。本文提供了幾種方法。html
這是redis-cli自帶的一個命令。對整個redis進行掃描,尋找較大的key。例:python
redis-cli -h b.redis -p 1959 --bigkeys
輸出git
# Scanning the entire keyspace to find biggest keys as well as # average sizes per key type. You can use -i 0.1 to sleep 0.1 sec # per 100 SCAN commands (not usually needed). [00.00%] Biggest hash found so far 's_9329222' with 3 fields [00.00%] Biggest string found so far 'url_http://mini.eastday.com/mobile/170722090206890.html?qid=sgllq&ch=east_sogou_push&pushid=13' with 8 bytes [00.00%] Biggest string found so far 'foo' with 40 bytes [00.00%] Biggest hash found so far 's_9329084' with 4 fields [00.23%] Biggest zset found so far 'region_hot_菏澤地' with 625 members [00.23%] Biggest zset found so far 'region_hot_葫蘆島' with 914 members [00.47%] Biggest string found so far 'top_notice_list' with 135193 bytes [00.73%] Biggest zset found so far 'region_hot_自貢' with 2092 members [01.90%] Biggest hash found so far 'uno_facet_2018-12-20' with 59 fields [11.87%] Biggest zset found so far 'region_hot_上海' with 2233 members [27.05%] Biggest set found so far 'blacklist_set_key' with 31832 members [73.87%] Biggest string found so far 'PUSH_NEWS' with 3104237 bytes [86.18%] Biggest zset found so far 'region_hot_北京' with 2688 members -------- summary ------- Sampled 4263 keys in the keyspace! Total key length in bytes is 174847 (avg len 41.02)
說明:github
該命令使用scan方式對key進行統計,因此使用時無需擔憂對redis形成阻塞。
輸出大概分爲兩部分,summary之上的部分,只是顯示了掃描的過程。summary部分給出了每種數據結構中最大的Key。
統計出的最大key只有string類型是以字節長度爲衡量標準的。list,set,zset等都是以元素個數做爲衡量標準,不能說明其佔的內存就必定多。因此,若是你的Key主要以string類型存在,這種方法就比較適合。
正則表達式
redis的命令,能夠查看某個key序列化後的長度。
例:redis
鏈接上redis後執行以下命令 b.redis:1959> hmset myhash k1 v1 k2 v2 k3 v3 OK b.redis:1959> debug object myhash Value at:0x7f005c6920a0 refcount:1 encoding:ziplist serializedlength:36 lru:3341677 lru_seconds_idle:2
關於輸出的項的說明:算法
幾個須要注意的問題
serializedlength是key序列化後的長度(redis在將key保存爲rdb文件時使用了該算法),並非key在內存中的真正長度。這就像一個數組在json_encode後的長度與其在內存中的真正長度並不相同。不過,它側面反應了一個key的長度,能夠用於比較兩個key的大小。
serializedlength會對字串作一些可能的壓縮。若是有些字串的壓縮比特別高,那麼在比較時會出現問題。好比下列:shell
b.redis:1959> set str1 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaa OK b.redis:1959> set str2 abcdefghijklmnopqrstuvwxyz1234 OK b.redis:1959> debug object str1 Value at:0x7f007c035b80 refcount:1 encoding:embstr serializedlength:12 lru:3342615 lru_seconds_idle:13 b.redis:1959> debug object str2 Value at:0x7f00654df400 refcount:1 encoding:embstr serializedlength:31 lru:3342622 lru_seconds_idle:7
兩個字串的實際長度都是30, 但str1的serializedlength爲12, str2的爲31。json
redis的官方文檔不是特別建議在客戶端使用該命令,可能由於計算serializedlength的代價相對高。因此若是要統計的key比較多,就不適合這種方法。
三. redis rdb tools
這是一個redis rdb file的分析工具,能夠根據rdb file生成內存報告。數組
3.1 安裝
須要python2.4以上版本和pip。
pip install rdbtools
首先咱們須要有一份rdb文件,若是你在配置中開啓了rdb,那麼redis會自動生成rdb文件。若是沒有,能夠手動執行bgsave。若是是線上機器,執行時要考慮機器負載等問題。拿到rdb文件後,咱們就能夠生成內存報告了。命令以下:
rdb -c memory file
例:
rdb -c memory /tmp/dump.rdb database,type,key,size_in_bytes,encoding,num_elements,len_largest_element,expiry 0,hash,data:index_flow_yingshi,10492,hashtable,1,8992,2019-01-14T08:20:10.236000 0,hash,data:index_movie,22068,hashtable,7,2896,2019-01-14T07:29:19.685000 0,string,block:index_module_novel,8296,string,7694,7694,2019-01-13T00:27:46.128000 0,string,block:index_bottom_baike_aikan,8296,string,7632,7632,2019-01-14T02:27:11.850000 0,string,block:index_bottom_tools,5224,string,4549,4549,2019-01-13T01:02:09.171000 0,string,block:index_module_travel,7272,string,6408,6408,2019-01-13T00:43:39.478000 ...
輸出了db,數據類型,key, 大小, 編碼等多列信息。至於分析數據,你能夠用shell,也能夠保存成csv用excel排序,或者乾脆存到db裏,想怎麼排怎麼排。
若是隻要知道最大的N個key, 可使用-l選項。例:
[@sjs_73_171 ~]$ rdb -c memory -l 3 /tmp/dump.rdb database,type,key,size_in_bytes,encoding,num_elements,len_largest_element,expiry 0,hash,city_tong,724236,hashtable,3113,216,2019-01-14T01:10:59.407000 0,hash,iplocsearch,406292,hashtable,383,180190,2019-01-30T05:37:56.082000 0,hash,weather_tong3,583844,hashtable,319,1658,2019-01-07T10:22:33.742000
若是咱們只須要查詢單個key所使用的內存能夠沒必要依賴rdb file, 使用redis-memory-for-key命令便可。
例:
[@sjs_73_171 WEB-INF]$ redis-memory-for-key -s b.redis -p 1959 myhash Key myhash Bytes 83 Type hash Encoding ziplist Number of Elements 3 Length of Largest Element 2 [@sjs_73_171 WEB-INF]$ redis-memory-for-key -s b.redis -p 1959 str1 Key str1 Bytes 80 Type string [@sjs_73_171 WEB-INF]$ redis-memory-for-key -s b.redis -p 1959 str2 Key str2 Bytes 80 Type string
3.4 更多
工具得出的內存值爲近似值,這點能夠參看做者的說明。「Why doesn’t reported memory match actual memory used?」
工具經過分析rdb file中的key及value,反算出該kv在內存中的大小。計算時充分考慮了數據類型的影響,key自己長度的影響,內存分配等多種因素。雖然得出的大小不是真實值,但用於key大小的比較是徹底能夠的。
rdb的功能不只於此,它還能夠將kv導成json格式,也能夠按正則表達式只導出部分key,
更多使用方法能夠查看
rdb --help
也能夠查看git上的幫助文檔。
四. 總結
若是想粗略的看下最大key, 可使用bigKeys。
若是查詢的key很少,key的壓縮比又沒有明顯差別,可使用debug object key。
若是不介意安裝個工具,那麼redis rdb tools彷佛是最佳選擇。
github地址:
https://github.com/sripathikrishnan/redis-rdb-tools
參考地址:
https://blog.csdn.net/yanyan19880509/article/details/79325191