高頻面試考點:Redis中有幾百萬數據量,如何進行高效訪問?

做者:老顧面試

來源:算法

https://dwz.cn/pm3pI6MZ緩存

本文版權歸做者全部服務器

1、前言

有時候咱們須要知道線上Redis使用狀況,尤爲須要知道一些前綴的key值,那咱們怎麼去查看呢?並且一般狀況下Redis裏的數據都是海量的,那麼咱們訪問Redis中的海量數據時,如何避免事故產生?運維

今天就經過咱們實際的一次生產事故,給你們分享一下!大數據

2、事故產生

由於咱們的用戶token緩存是採用了【user_token:userid】格式的key,保存用戶的token的值。線程

咱們運維爲了幫助開發小夥伴們查一下線上如今有多少登陸用戶,直接用了keys user_token*方式進行查詢,事故就此發生了:致使Redis不可用,假死。orm

3、分析緣由

咱們線上的登陸用戶有幾百萬,數據量比較多;keys算法是遍歷算法,複雜度是O(n),也就是數據越多,時間越高。cdn

數據量達到幾百萬,keys這個指令就會致使 Redis 服務卡頓,由於 Redis 是單線程程序,順序執行全部指令,其它指令必須等到當前的 keys 指令執行完了才能夠繼續。blog

4、解決方案

那咱們如何去遍歷大數據量呢?其實這個也是面試常常問的。咱們能夠採用Redis的另外一個命令scan。

咱們看一下scan的特色:

  • 複雜度雖然也是 O(n),可是它是經過遊標分步進行的,不會阻塞線程

  • 提供 count 參數,不是結果數量,是Redis單次遍歷字典槽位數量(約等於)

  • 同 keys 同樣,它也提供模式匹配功能;

  • 服務器不須要爲遊標保存狀態,遊標的惟一狀態就是 scan 返回給客戶端的遊標整數;

  • 返回的結果可能會有重複,須要客戶端去重複,這點很是重要;

  • 單次返回的結果是空的並不意味着遍歷結束,而要看返回的遊標值是否爲零

4.一、scan命令格式


4.二、命令解釋

scan 遊標 MATCH <返回和給定模式相匹配的元素> count 每次迭代所返回的元素數量

  • SCAN命令是增量的循環,每次調用只會返回一小部分的元素。因此不會讓Redis假死;

  • SCAN命令返回的是一個遊標,從0開始遍歷,到0結束遍歷;

4.三、舉例


從0開始遍歷,返回了遊標6,又返回了數據,繼續scan遍歷,就要從6開始


5、總結

這個是面試常常會問到的,也是咱們小夥伴在工做的過程常常用的,通常數據量不大的時候,不會有什麼問題,但數據量多的時候,你的操做方式不對,你的績效就會被扣哦。


End


長按下圖二維碼,即刻關注【狸貓技術窩】

阿里、京東、美團、字節跳動 頂尖技術專家坐鎮

爲IT人打造一個 「有溫度」 的技術窩!

相關文章
相關標籤/搜索