Linux中級之負載均衡（lvs,nginx,haproxy）、中間件

時間 2019-11-26

標籤 linux 中級負載均衡 lvs nginx haproxy 中間件欄目 Linux 简体版

原文原文鏈接

1、負載均衡的概念mysql

1、系統的擴展方式：linux

scale up：向上擴展nginx

scale out：向外擴展算法

2、集羣類型： LB（Load Balancing）、HA（high availability）sql

3、LB集羣的實現數據庫

硬件：F5、Redwareapache

軟件：lvs、haproxy、nginx編程

4、基於工做的協議層劃分：後端

傳輸層：瀏覽器

Lvs：工做在內核模塊中

HAProxy：

1.mode tcp，若是工做在應用層只能調度http協議，若是基於tcp協議它可以調度https，mysql等經常使用的tcp協議

2.haproxy只是模擬tcp協議，由於tcp協議工做在內核當中，而haproxy屬於應用程序工做在第七層，是工做在某個套接字上的應用程序

應用層：haproxy，nginx

從負載均衡設備的角度來看，分爲硬件負載均衡和軟件負載均衡：

硬件負載均衡：好比最多見的F5，還有Array等，這些負載均衡是商業的負載均衡器，性能比較好，畢竟他們的就是爲了負載均衡而生的，背後也有很是成熟的團隊，能夠提供各類解決方案，可是價格比較昂貴，因此沒有充足的理由，充足的軟妹幣是不會考慮的。

軟件負載均衡：包括咱們耳熟能詳的Nginx，LVS，Tengine（阿里對Nginx進行的改造）等。優勢就是成本比較低，可是也須要有比較專業的團隊去維護，要本身去踩坑，去DIY。

從負載均衡的技術來看，分爲服務端負載均衡和客戶端負載均衡：

服務端負載均衡：當咱們訪問一個服務，請求會先到另一臺服務器，而後這臺服務器會把請求分發到提供這個服務的服務器，固然若是隻有一臺服務器，那好說，直接把請求給那一臺服務器就能夠了，可是若是有多臺服務器呢？這時候，就會根據必定的算法選擇一臺服務器。

客戶端負載均衡：客戶端服務均衡的概念貌似是有了服務治理才產生的，簡單的來講，就是在一臺服務器上維護着全部服務的ip，名稱等信息，當咱們在代碼中訪問一個服務，是經過一個組件訪問的，這個組件會從那臺服務器上取到全部提供這個服務的服務器的信息，而後經過必定的算法，選擇一臺服務器進行請求。

2、三大主流軟件負載均衡器對比(LVS、Nginx、HAproxy)

1、LVS：

1. 抗負載能力強，性能高，能達到F5的60%，對內存和CPU資源消耗比較低

2. 工做在網絡4層，經過VRRP協議(僅做代理分發之用)，具體的流量是由linux內核來處理，所以沒有流量的產生。

3. 穩定，可靠性高，自身有完美的熱備方案(Keepalived+lvs)

4. 不支持正則處理，不能作動靜分離；但應用範圍比較廣，能夠對全部應用作負載均衡

5. 支持多種負載均衡算法：rr(輪詢)，wrr(帶權輪詢)、lc(最小鏈接)、wlc(帶權最小鏈接)

6. 配置相對複雜，對網絡依賴比較大，穩定性很高。

7. LVS工做模式有4種：

(1) nat 地址轉換

(2) dr 直接路由

(3) tun 隧道

(4) full-nat

2、Nginx：

1. 工做在網絡7層，能夠針對http應用作一些分流的策略，好比針對域名，目錄結構

2. Nginx對網絡的依賴較小，理論上能ping通就能進行負載功能

3. Nginx安裝配置比較簡單，測試起來很方便

4. 也能夠承擔較高的負載壓力且穩定，nginx是爲解決c10k問題而誕生的，通常能支撐超過1萬次的併發

5. 對後端服務器的健康檢查，只支持經過端口來檢測，不支持經過url來檢測

6. Nginx對請求的異步處理能夠幫助節點服務器減輕負載壓力

7. Nginx僅能支持http、https和Email協議，這樣就在適用範圍較小。

8. 不支持Session的直接保持，但能經過ip_hash來解決。對Big request header的支持不是很好。

9. Nginx還能作Web服務器即Cache功能。

10. 支持負載均衡算法：Round-robin（輪循）、Weight-round-robin（帶權輪循）、Ip-hash（IP哈希）

第6點補充：

squid同步處理：瀏覽器發起請求，然後請求會馬上被轉到後端，因而在瀏覽器和後臺之間就創建了一個通道。從請求發起直到請求完成，這條通道都是一直存在的。

nginx異步處理：瀏覽器發起請求，請求不會馬上轉到後端，而是請求數據(header)先收到nignx上，而後nginx再把這個請求發到後端，後端處理完成後把數據返回到nginx上，nginx將數據流發到瀏覽器。

使用異步處理的好處：

1. 假設用戶執行一個上傳文件操做，由於用戶網速又比較慢，所以須要花半個小時才能把文件傳到服務器。squid的同步代理在用戶開始上傳後就和後臺創建了鏈接，半小時後文件上傳結束，因而可知，後臺服務器鏈接保持了半個小時；而nginx異步代理就是先將此文件收到nginx上，所以僅僅是nginx和用戶保持了半小時鏈接，後臺服務器在這半小時內沒有爲這個請求開啓鏈接，半小時後用戶上傳結束，nginx纔將上傳內容發到後臺，nginx和後臺之間的帶寬是很充裕的，因此只花了一秒鐘就將請求發送到了後臺，因而可知，後臺服務器鏈接保持了一秒。同步傳輸花了後臺服務器半個小時，異步傳輸只花一秒，可見優化程度很大。

2. 在上面這個例子中，假如後臺服務器由於種種緣由重啓了，上傳文件就天然中斷了，這對用戶來講是很是惱火的一件事情，想必各位也有上傳文件傳到一半被中斷的經歷。用nginx代理以後，後臺服務器的重啓對用戶上傳的影響減小到了極點，而nginx是很是穩定的並不須要常去重啓它，即便須要重啓，利用kill -HUP就能夠作到不間斷重啓nginx。

3. 異步傳輸能夠令負載均衡器更有保障，爲何這麼說呢？在其它的均衡器（lvs/haproxy/apache等）裏，每一個請求都是隻有一次機會的，假如用戶發起一個請求，結果該請求分到的後臺服務器恰好掛掉了，那麼這個請求就失敗了；而nginx由於是異步的，因此這個請求能夠從新發往下一個後臺，下一個後臺返回了正常的數據，因而這個請求就能成功了。仍是用用戶上傳文件這個例子，假如不但用了nginx代理，並且用了負載均衡，nginx把上傳文件發往其中一臺後臺，但這臺服務器忽然重啓了，nginx收到錯誤後，會將這個上傳文件發到另外一臺後臺，因而用戶就不用再花半小時上傳一遍。

4. 假如用戶上傳一個10GB大小的文件，然後臺服務器沒有考慮到這個狀況，那麼後臺服務器豈不要崩潰了。用nginx就能夠把這些東西都攔在nginx上，經過nginx的上傳文件大小限制功能來限制，另外nginx性能很是有保障，就放心的讓互聯網上那些另類的用戶和nginx對抗去吧。

用異步傳輸會形成問題：

後臺服務器有提供上傳進度的功能的話，用了nginx代理就沒法取得進度，這個須要使用nginx的一個第三方模塊來實現。

第8點補充：

Nginx upstream支持的分配策略及原理：

1. 輪詢(默認)：每一個請求按照順序逐一分配到不一樣的後端服務器。如後端服務器down掉，就切換到另外一臺並剔除down的後端主機

2. weight：指定輪詢概率，weight和訪問比率成正比，用於後端服務器性能不均的狀況。

3. ip_hash：每一個請求按照訪問ip的hash結果分配，不一樣ip的請求被分配到後端不一樣的服務器上，能夠解決session的問題。

3、HAProxy:

1. 支持兩種代理模式：TCP（四層）和HTTP（七層），支持虛擬主機；

2. 可以補充Nginx的一些缺點好比Session的保持，Cookie的引導等工做

3. 支持url檢測後端的服務器出問題的檢測會有很好的幫助。

4. 更多的負載均衡策略好比：動態加權輪循(Dynamic Round Robin)，加權源地址哈希(Weighted Source Hash)，加權URL哈希和加權參數哈希(Weighted Parameter Hash)已經實現

5. 單純從效率上來說HAProxy更會比Nginx有更出色的負載均衡速度。

6. HAProxy能夠對Mysql進行負載均衡，對後端的DB節點進行檢測和負載均衡。

7. 支持負載均衡算法：Round-robin（輪循）、Weight-round-robin（帶權輪循）、source（原地址保持）、RI（請求URL）、rdp-cookie（根據cookie）

8. 不能作Web服務器即Cache。

三大主流軟件負載均衡器適用業務場景：

1. 網站建設初期，能夠選用Nginx、HAProxy做爲反向代理負載均衡(流量不大時，能夠不選用負載均衡)，由於其配置簡單，性能也能知足通常業務場景。若是考慮到負載均衡器是有單點問題，能夠採用Nginx+Keepalived/HAproxy+Keepalived避免負載均衡器自身的單點問題。

2. 網站併發到達必定程度後，爲了提升穩定性和轉發效率，可使用lvs，畢竟lvs比Nginx/HAProxy要更穩定，轉發效率也更高。

注：nginx與HAProxy比較：nginx只支持七層，用戶量最大，穩定性比較可靠。Haproxy支持四層和七層，支持更多的負載均衡算法，支持session等。

衡量負載均衡器好壞的幾個重要的因素：

1. 會話率：單位時間內的處理的請求數

2. 會話併發能力：併發處理能力

3. 數據率：處理數據能力

3、中間件

中間件是在操做系統功能範圍外爲應用提供服務的多用途軟件。任何位於內核和用戶應用之間的軟件均可以是中間件。中間件不提供傳統應用的功能，而是將軟件與其餘軟件銜接。因爲中間件可以讓數據從一個應用流動到另外一箇中，所以把它比做輸水管最爲貼切。

中間件就是程序中可織入的，可重用的，與業務邏輯無關的各類組件。

中間件(middleware)是基礎軟件的一大類，屬於可複用軟件的範疇。

顧名思義，中間件處於操做系統軟件與用戶的應用軟件的中間。

中間件在操做系統、網絡和數據庫之上，應用軟件的下層，總的做用是爲處於本身上層的應用軟件提供運行與開發的環境，幫助用戶靈活、高效地開發和集成複雜的應用軟件。

在衆多關於中間件的定義中，比較廣泛被接受的是 IDC 表述的：中間件是一種獨立的系統軟件或服務程序，分佈式應用軟件藉助這種軟件在不一樣的技術之間共享資源，中間件位於客戶機服務器的操做系統之上，管理計算資源和網絡通訊。

分類：數據訪問中間件，遠程調用中間件，消息中間件，交易中間件，對象中間件。

舉例：

1. RMI (Remote Method Invocations, 遠程調用)

2. Load Balancing(負載均衡，將訪問負荷分散到各個服務器中)

3. Transparent Fail-over(透明的故障切換)

4. Clustering(集羣 , 用多個小的服務器代替大型機)

5. Back-end-Integration(後端集成，用現有的、新開發的系統如何去集成遺留的系統)

6. T ransaction 事務(全局 / 局部)全局事務(分佈式事務)局部事務(在同一數據庫聯接內的事務)

7. Dynamic Redeployment (動態從新部署 , 在不中止原系統的狀況下，部署新的系統)

8. System Management(系統管理)

9. Threading(多線程處理)

10. Message-oriented Middleware 面向消息的中間件(異步的調用編程)

11. Component Life Cycle(組件的生命週期管理)

12. Resource pooling (資源池)

13. Security (安全)

14. Caching (緩存)

4、cookie和session

一、Cookie是服務器存儲在本地計算機上的小塊文本，並隨每一個請求發送到同一服務器。 IETF RFC 2965 HTTP狀態管理機制是一種通用的cookie規範。 Web服務器使用HTTP標頭將cookie發送到客戶端。在客戶端終端，瀏覽器解析cookie並將其保存爲本地文件，該文件自動未來自同一服務器的任何請求綁定到這些cookie。

具體來講，cookie機制使用一種在客戶端維護狀態的方案。它是客戶端會話狀態的存儲機制，他須要用戶打開客戶端的cookie支持。 Cookie的做用是解決HTTP協議中缺乏無狀態缺陷的問題。

二、session會話機制是一種服務器端機制，它使用相似於哈希表（可能還有哈希表）的結構來保存信息。

當程序須要爲客戶端的請求建立會話時，服務器首先檢查客戶端的請求是否包含會話標識符（稱爲會話ID）。若是包含它，它先前已爲此客戶端建立了一個會話。服務器根據會話ID檢索會話（沒法檢索，將建立新會話），若是客戶端請求不包含會話ID，則爲客戶端建立會話並生成與會話關聯的會話ID。 session id應該是一個既不重複也不容易被複制的字符串。會話ID將返回給客戶端以保存此響應。

三、Session是保存在服務器上的數據結構，用於跟蹤用戶的狀態。此數據能夠保存在羣集、數據庫、文件中。

Cookie是客戶端存儲用戶信息的機制。它用於記錄有關用戶的一些信息，是實現會話的一種方式。