爲何說Redis是單線程的?

近乎全部與Java相關的面試都會問到緩存的問題,基礎一點的會問到什麼是「二八定律」「熱數據和冷數據」 ,複雜的會問到緩存雪崩緩存穿透緩存預熱緩存更新緩存降級等問題,這些看似不常見的概念,都與咱們的緩存服務器相關,通常經常使用的緩存服務器有Redis、Memcached等,而筆者目前最經常使用的也只有Redis這一種。面試

若是你在之前面試的時候尚未遇到面試官問你:爲何說Redis是單線程或者Redis爲何這麼快?,那麼你看到這篇文章的時候,你應該以爲是一件很幸運的事情!若是你恰好是一位高逼格的面試官,你也能夠拿這道題去面試對面「望穿秋水」般的小夥伴,測試一下他的掌握程度。redis

好啦!步入正題!咱們先探討一下Redis是什麼,Redis爲何這麼快、而後在探討一下爲何Redis是單線程的?spring

clipboard.png

1、Redis簡介

Redis是一個開源的內存中的數據結構存儲系統,它能夠用做:數據庫、緩存和消息中間件。數據庫

它支持多種類型的數據結構,如字符串(Strings)、散列(Hash)、列表(List)、集合(Set)、有序集合(Sorted Set或者是ZSet)與範圍查詢、Bitmaps、Hyperloglogs 和地理空間(Geospatial)索引半徑查詢。其中常見的數據結構類型有:String、List、Set、Hash、ZSet這5種。後端

Redis內置了複製(Replication),LUA腳本(Lua scripting), LRU驅動事件(LRU eviction),事務(Transactions) 和不一樣級別的磁盤持久化(Persistence),並經過 Redis哨兵(Sentinel)和自動分區(Cluster)提供高可用性(High Availability)。緩存

Redis也提供了持久化的選項,這些選項可讓用戶將本身的數據保存到磁盤上面進行存儲。根據實際狀況,能夠每隔必定時間將數據集導出到磁盤(快照),或者追加到命令日誌中(AOF只追加文件),他會在執行寫命令時,將被執行的寫命令複製到硬盤裏面。您也能夠關閉持久化功能,將Redis做爲一個高效的網絡的緩存數據功能使用。服務器

Redis不使用表,他的數據庫不會預約義或者強制去要求用戶對Redis存儲的不一樣數據進行關聯。微信

數據庫的工做模式按存儲方式可分爲:硬盤數據庫和內存數據庫。Redis 將數據儲存在內存裏面,讀寫數據的時候都不會受到硬盤 I/O 速度的限制,因此速度極快。網絡

一、硬盤數據庫的工做模式: 數據結構

圖片描述

二、內存數據庫的工做模式:

圖片描述

看完上述的描述,對於一些常見的Redis相關的面試題,是否有所認識了,例如:什麼是Redis、Redis常見的數據結構類型有哪些、Redis是如何進行持久化的等。

2、Redis到底有多快

Redis採用的是基於內存的採用的是單進程單線程模型的 KV 數據庫,由C語言編寫,官方提供的數據是能夠達到100000+的QPS(每秒內查詢次數)。這個數據不比採用單進程多線程的一樣基於內存的 KV 數據庫 Memcached 差!有興趣的能夠參考官方的基準程序測試:https://redis.io/topics/bench...

圖片描述

橫軸是鏈接數,縱軸是QPS。此時,這張圖反映了一個數量級,但願你們在面試的時候能夠正確的描述出來,不要問你的時候,你回答的數量級相差甚遠!

3、Redis爲何這麼快

一、徹底基於內存,絕大部分請求是純粹的內存操做,很是快速。數據存在內存中,相似於HashMap,HashMap的優點就是查找和操做的時間複雜度都是O(1);

二、數據結構簡單,對數據操做也簡單,Redis中的數據結構是專門進行設計的;

三、採用單線程,避免了沒必要要的上下文切換和競爭條件,也不存在多進程或者多線程致使的切換而消耗 CPU,不用去考慮各類鎖的問題,不存在加鎖釋放鎖操做,沒有由於可能出現死鎖而致使的性能消耗;

四、使用多路I/O複用模型,非阻塞IO;

五、使用底層模型不一樣,它們之間底層實現方式以及與客戶端之間通訊的應用協議不同,Redis直接本身構建了VM 機制 ,由於通常的系統調用系統函數的話,會浪費必定的時間去移動和請求;

以上幾點都比較好理解,下邊咱們針對多路 I/O 複用模型進行簡單的探討:

多路I/O複用模型是利用 select、poll、epoll 能夠同時監察多個流的 I/O 事件的能力,在空閒的時候,會把當前線程阻塞掉,當有一個或多個流有 I/O 事件時,就從阻塞態中喚醒,因而程序就會輪詢一遍全部的流(epoll 是隻輪詢那些真正發出了事件的流),而且只依次順序的處理就緒的流,這種作法就避免了大量的無用操做。

這裏「多路」指的是多個網絡鏈接,「複用」指的是複用同一個線程。採用多路 I/O 複用技術可讓單個線程高效的處理多個鏈接請求(儘可能減小網絡 IO 的時間消耗),且 Redis 在內存中操做數據的速度很是快,也就是說內存內的操做不會成爲影響Redis性能的瓶頸,主要由以上幾點造就了 Redis 具備很高的吞吐量。

除了這些,針對當前互聯網公司的技術需求以及結合主流技術,我本身整理了一套系統的架構技術體系,當你技術過硬的時候,可以解決技術問題纔會服衆。很多公司都很重視高併發高可用的技術,特別是一線互聯網公司,分佈式、JVM、spring源碼分析、微服務等知識點已經是面試的必考題,這些東西可能大家平時在工做中接觸過,可是缺乏的全面系統的學習,加入後端開發羣:943918498,或是關注微信公衆號:Java資訊庫,回覆「架構」,免費領取架構資料。

4、那麼爲何Redis是單線程的

咱們首先要明白,上邊的種種分析,都是爲了營造一個Redis很快的氛圍!官方FAQ表示,由於Redis是基於內存的操做,CPU不是Redis的瓶頸,Redis的瓶頸最有多是機器內存的大小或者網絡帶寬。既然單線程容易實現,並且CPU不會成爲瓶頸,那就瓜熟蒂落地採用單線程的方案了(畢竟採用多線程會有不少麻煩!)。

圖片描述

看到這裏,你可能會氣哭!本覺得會有什麼重大的技術要點才使得Redis使用單線程就能夠這麼快,沒想到就是一句官方看似糊弄咱們的回答!可是,咱們已經能夠很清楚的解釋了爲何Redis這麼快,而且正是因爲在單線程模式的狀況下已經很快了,就沒有必要在使用多線程了!

可是,咱們使用單線程的方式是沒法發揮多核CPU 性能,不過咱們能夠經過在單機開多個Redis 實例來完善!

警告1:這裏咱們一直在強調的單線程,只是在處理咱們的網絡請求的時候只有一個線程來處理,一個正式的Redis Server運行的時候確定是不止一個線程的,這裏須要你們明確的注意一下!例如Redis進行持久化的時候會以子進程或者子線程的方式執行(具體是子線程仍是子進程待讀者深刻研究);例如我在測試服武器上查看Redis進程,而後找到該進程下的線程:

圖片描述

ps命令的「-T」參數表示顯示線程(Show threads, possibly with SPID column.)「SID」欄表示線程ID,而「CMD」欄則顯示了線程名稱。

警告2:在上圖中FAQ中的最後一段,表述了從Redis 4.0版本開始會支持多線程的方式,可是,只是在某一些操做上進行多線程的操做!因此該篇文章在之後的版本中是否仍是單線程的方式須要讀者考證!

5、擴展

如下也是你應該知道的幾種模型,祝你的面試一臂之力!

一、單進程多線程模型:MySQL、Memcached、Oracle(Windows版本);

二、多進程模型:Oracle(Linux版本);

三、Nginx有兩類進程,一類稱爲Master進程(至關於管理進程),另外一類稱爲Worker進程(實際工做進程)。啓動方式有兩種:

(1)單進程啓動:此時系統中僅有一個進程,該進程既充當Master進程的角色,也充當Worker進程的角色。

(2)多進程啓動:此時系統有且僅有一個Master進程,至少有一個Worker進程工做。

(3)Master進程主要進行一些全局性的初始化工做和管理Worker的工做;事件處理是在Worker中進行的。

圖片描述

相關文章
相關標籤/搜索