系統:CentOS6.7
配置:4C8G
應用:Redis Cluster,實例化redis
一、沒法啓動redis,啓動後系統OOM,直接殺死
二、Redis: OOM command not allowed when used memory > ‘maxmemory’網絡
內存已滿,不容許數據在寫入
注:
used_memory_human表示已用內存
used_memory_rss表示系統給redis分配的內存(即常駐內存)
mem_fragmentation_ratio=used_memory_rss/used_memory比例,通常狀況下,used_memory_rss略高於used_memory,當內存碎片較多時,則mem_fragmentation_ratio會較大,能夠反映內存碎片是否不少運維
一、首先查看redis的內存使用,如上圖。能夠看到已用內存5G多,常駐內存3.8G多。而咱們的機器內存只有8G可用。明顯內存已經充爆。接下來想到的就應該是key的量太大了仍是value的量太大了。
二、找出redis中的key。測試
###查看key的個數(最好是把key拿出來分析)keys *echo "keys *" |/usr/local/redis/bin/redis-cli -p 6381 > /tmp/6381.log
三、分析發現key中有650000的common:order:LogCacheKey這樣的key,接下來咱們須要確認下這些key的大小spa
###查看key大小的命令debug objectecho 'debug object "common:order:LogCacheKey90bef863-dfc7-4739-8404-9b6624a70196"' |/usr/local/redis/bin/redis-cli -p 6381
四、分析發現common:order:LogCacheKey所佔用的內存爲3G左右。所以找到元兇爲這個key所致使的。
五、清理keydebug
for i in `grep common:order:Log 6381.log`;do echo "del $i" |/usr/local/redis/bin/redis-cli -p 6381; done
六、key已經找到刪除,如今要查找是哪一個應用產生的。
由於開發人員沒在,那從運維角度,我是從網絡流量來分析的,使用iftop
根據流量大小,找到對應的主機,聯繫到開發人員確認。code
若是key少的話,能夠直接取出每一個key對應的value的大小,按照從大到小的順序排序blog
for i in `cat /tmp/6379.log`;do echo -n "$i "; echo "debug object $i"|/usr/local/redis/bin/redis-cli -p 6379|awk -F '[ |:]+' '{print $9}';done|sort -r -n -k2
一、問題發生後,用最快最簡單的方式先把問題解決。減小影響的時間。好比升級擴大內存。
二、這次遇到的問題是在測試環境,若是確認redis中數據能夠清除,能夠使用暴力的方式直接清空本地的實例化文件,將內存釋放出來。可是生產環境切不可進行此操做。排序