沒有預熱，這不叫高併發，叫併發高

時間 2019-12-05

標籤沒有預熱併發简体版

原文原文鏈接

做者：小姐姐味道
連接：https://juejin.im/post/5d10c21ee51d4576bc1a0e26node

前言：nginx

你們都知道，高併發系統有三把斧子：緩存、熔斷和限流。但還有一把斧子，常常被遺忘在角落裏，鬱郁不得志，那就是預熱。sql

現象舉例

先說兩個現象。這些現象，只能在併發高的系統中出現。
好吧，它已經引發了多個故障。後端

1、DB重啓後，瞬間死亡

一個高併發環境下的DB，進程死亡後進行重啓。因爲業務處在高峯期間，上游的負載均衡策略發生了重分配。剛剛啓動的DB瞬間接受了1/3的流量，而後load瘋狂飆升，直至再無響應。緩存

緣由就是：新啓動的DB，各類Cache並無準備完畢，系統狀態與正常運行時大相徑庭。可能日常1/10的量，就可以把它帶入死亡。服務器

2、服務重啓後，訪問異常

另一個常見的問題是：個人一臺服務器發生了問題，因爲負載均衡的做用，剩下的機器立馬承載了這些請求，運行的很好。當服務從新加入集羣時，卻發生了大量高耗時的請求，在請求量高的狀況下，甚至大批大批的失敗。架構

引發的緣由大概能夠歸結於：併發

一、服務啓動後，jvm並未徹底準備完畢，JIT未編譯等。
二、應用程序使用的各類資源未準備就緒。
三、負載均衡發生了rebalance。負載均衡

這兩個問題，都是沒有作好預熱jvm

Warm Up，即冷啓動/預熱的方式。當系統長期處於低水位的狀況下，流量忽然增長時，直接把系統拉昇到高水位可能瞬間把系統壓垮。經過"冷啓動"，讓經過的流量緩慢增長，在必定時間內逐漸增長到閾值上限，給冷系統一個預熱的時間，避免冷系統被壓垮。

我想要這樣的曲線。

而不是這樣的。

事實要複雜的多

流量是不可預測的，這不一樣於天然增加的流量，或者人爲的攻擊----這是一個從無到有的過程。甚至一些自誇超高速的組件，如lmax的disruptor，在這種忽然到來的洪峯之下也會崩潰。

warmup最合適的切入層面就是網關。如圖：node4是剛啓動的節點，集成在網關中的負載均衡組件，將可以識別出這臺剛加入的實例，而後逐步放量到這臺機器，直到它可以真正承受高速流量。

假如全部的請求，都通過網關，一切都好辦的多，也有像Sentinel 之類的組件進行切入。但現實狀況每每不能知足條件。好比：

一、你的應用直接獲取了註冊中心的信息，而後在客戶端組件中進行了流量分配。
二、你的應用經過了一些複雜的中間件和路由規則，最終定位到某一臺DB上。
三、你的終端，可能經過了MQTT協議，直接連上了MQTT服務端。

咱們進行一下抽象，能夠看到：全部這些流量分配邏輯，包括網關，均可以叫作客戶端。即全部的warmup邏輯都是放在客戶端的，它們都與負載均衡緊密耦合在一塊兒。

解決方式

接口放量

按照以上的分析，經過編碼手段控制住全部的客戶端調用，便可解決問題。

一個簡單的輪詢方式

一、我要能拿到全部要調用資源的集合，以及啓動時間，冷啓動的配置等。
二、給這些資源分配一些權重，好比最大權重爲100，配置100秒以後冷啓動成功。假如如今是第15秒，則總權重就是100*(n-1)+15。
三、根據算好的權重，進行分配，流量會根據時間流逝逐步增長，直到與其餘節點等同。
四、一個極端狀況，個人後端只有1個實例，根本就啓動不起來。

拿SpringCloud來講，咱們就要改變這些組件的行爲。

一、ribbon的負載均衡策略。
二、網關的負載均衡策略。

還好，它們都是基礎組件，不用來回拷貝代碼了。

蜻蜓點水

顧名思義，意思就是把全部的接口都提早訪問一遍，讓系統對資源進行提早準備。好比，遍歷全部的http鏈接，而後發送請求。這種方法是部分有效的，一些懶加載的資源會在這個階段陸續加載進來，但不是所有。 JIT等一些加強功能，可能使得預熱過程變得很是的長，蜻蜓點水的方式，只能在必定程度上有做用。

再好比某些DB，在啓動以後，會執行一些很是有特色的sql，使得PageCache里加載到最須要的熱數據。

狀態保留

系統在死亡時作一個快照，而後在啓動時，原封不動的還原回來。

這個過程就比較魔幻了，由於通常的非正常關閉，系統根本沒有機會發表遺言，因此只能定時的，在運行中的系統中作快照。

節點在啓動時，再將快照加載到內存中。這在一些內存型的組件中應用普遍。

《Java架構資料贈送》

這裏有一份（高可用、高併發、高性能及分佈式、Jvm性能調優、Spring源碼，MyBatis，Netty，Redis，Kafka，Mysql，Zookeeper，Tomcat，Docker，Dubbo，Nginx等多個知識點的架構資料）以及Java進階學習路線圖，進羣便可領取，羣號：468897908。

End

經過比較，咱們發現，最靠譜的方式仍是進行編碼，將warmup邏輯集成在客戶端。這個工做多是痛苦的、漫長的，但結局是美好的。固然也能夠經過「摘除nginx->修改權重->reload nginx」的方式。有時頗有效但不老是有效，一般很放心但不老是放心。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。