Django高併發負載均衡

1 什麼是負載均衡?

當一臺服務器的性能達到極限時,咱們可使用服務器集羣來提升網站的總體性能。那麼,在服務器集羣中,須要有一臺服務器充當調度者的角色,用戶的全部請求都會首先由它接收,調度者再根據每臺服務器的負載狀況將請求分配給某一臺後端服務器去處理。

那麼在這個過程當中,調度者如何合理分配任務,保證全部後端服務器都將性能充分發揮,從而保持服務器集羣的總體性能最優,這就是負載均衡問題。

下面詳細介紹負載均衡的四種實現方式java

2 HTTP重定向實現負載均衡

過程描述

當用戶向服務器發起請求時,請求首先被集羣調度者截獲;調度者根據某種分配策略,選擇一臺服務器,並將選中的服務器的IP地址封裝在HTTP響應消息頭部的Location字段中,並將響應消息的狀態碼設爲302,最後將這個響應消息返回給瀏覽器。

當瀏覽器收到響應消息後,解析Location字段,並向該URL發起請求,而後指定的服務器處理該用戶的請求,最後將結果返回給用戶。

在使用HTTP重定向來實現服務器集羣負載均衡的過程當中,須要一臺服務器做爲請求調度者。用戶的一項操做須要發起兩次HTTP請求,一次向調度服務器發送請求,獲取後端服務器的IP,第二次向後端服務器發送請求,獲取處理結果。linux

調度策略

調度服務器收到用戶的請求後,究竟選擇哪臺後端服務器處理請求,這由調度服務器所使用的調度策略決定。

    隨機分配策略
    當調度服務器收到用戶請求後,能夠隨機決定使用哪臺後端服務器,而後將該服務器的IP封裝在HTTP響應消息的Location屬性中,返回給瀏覽器便可。

    輪詢策略(RR)
    調度服務器須要維護一個值,用於記錄上次分配的後端服務器的IP。那麼當新的請求到來時,調度者將請求依次分配給下一臺服務器。

因爲輪詢策略須要調度者維護一個值用於記錄上次分配的服務器IP,所以須要額外的開銷;此外,因爲這個值屬於互斥資源,那麼當多個請求同時到來時,爲了不線程的安全問題,所以須要鎖定互斥資源,從而下降了性能。而隨機分配策略不須要維護額外的值,也就不存在線程安全問題,所以性能比輪詢要高。web

優缺點分析

採用HTTP重定向來實現服務器集羣的負載均衡實現起來較爲容易,邏輯比較簡單,但缺點也較爲明顯。

在HTTP重定向方法中,調度服務器只在客戶端第一次向網站發起請求的時候起做用。當調度服務器向瀏覽器返回響應信息後,客戶端此後的操做都基於新的URL進行的(也就是後端服務器),此後瀏覽器就不會與調度服務器產生關係,進而會產生以下幾個問題:

    因爲不一樣用戶的訪問時間、訪問頁面深度有所不一樣,從而每一個用戶對各自的後端服務器所形成的壓力也不一樣。而調度服務器在調度時,沒法知道當前用戶將會對服務器形成多大的壓力,所以這種方式沒法實現真正意義上的負載均衡,只不過是把請求次數平均分配給每臺服務器罷了。
    若分配給該用戶的後端服務器出現故障,而且若是頁面被瀏覽器緩存,那麼當用戶再次訪問網站時,請求都會發給出現故障的服務器,從而致使訪問失敗數據庫

3 DNS負載均衡

DNS是什麼

在瞭解DNS負載均衡以前,咱們首先須要瞭解DNS域名解析的過程。

咱們知道,數據包採用IP地址在網絡中傳播,而爲了方便用戶記憶,咱們使用域名來訪問網站。那麼,咱們經過域名訪問網站以前,首先須要將域名解析成IP地址,這個工做是由DNS完成的。也就是域名服務器。

咱們提交的請求不會直接發送給想要訪問的網站,而是首先發給域名服務器,它會幫咱們把域名解析成IP地址並返回給咱們。咱們收到IP以後纔會向該IP發起請求。

那麼,DNS服務器有一個自然的優點,若是一個域名指向了多個IP地址,那麼每次進行域名解析時,DNS只要選一個IP返回給用戶,就可以實現服務器集羣的負載均衡。apache

具體作法

首先須要將咱們的域名指向多個後端服務器(將一個域名解析到多個IP上),再設置一下調度策略,那麼咱們的準備工做就完成了,接下來的負載均衡就徹底由DNS服務器來實現。

當用戶向咱們的域名發起請求時,DNS服務器會自動地根據咱們事先設定好的調度策略選一個合適的IP返回給用戶,用戶再向該IP發起請求。後端

調度策略

通常DNS提供商會提供一些調度策略供咱們選擇,如隨機分配、輪詢、根據請求者的地域分配離他最近的服務器。瀏覽器

優缺點分析

DNS負載均衡最大的優勢就是配置簡單。服務器集羣的調度工做徹底由DNS服務器承擔,那麼咱們就能夠把精力放在後端服務器上,保證他們的穩定性與吞吐量。並且徹底不用擔憂DNS服務器的性能,即使是使用了輪詢策略,它的吞吐率依然卓越。

此外,DNS負載均衡具備較強了擴展性,你徹底能夠爲一個域名解析較多的IP,並且不用擔憂性能問題。

可是,因爲把集羣調度權交給了DNS服務器,從而咱們沒辦法爲所欲爲地控制調度者,沒辦法定製調度策略。

DNS服務器也沒辦法瞭解每臺服務器的負載狀況,所以沒辦法實現真正意義上的負載均衡。它和HTTP重定向同樣,只不過把全部請求平均分配給後端服務器罷了。

此外,當咱們發現某一臺後端服務器發生故障時,即便咱們當即將該服務器從域名解析中去除,但因爲DNS服務器會有緩存,該IP仍然會在DNS中保留一段時間,那麼就會致使一部分用戶沒法正常訪問網站。這是一個致命的問題!好在這個問題能夠用動態DNS來解決。緩存

動態DNS

動態DNS可以讓咱們經過程序動態修改DNS服務器中的域名解析。從而當咱們的監控程序發現某臺服務器掛了以後,能當即通知DNS將其刪掉。tomcat

綜上所述

DNS負載均衡是一種粗獷的負載均衡方法,這裏只作介紹,不推薦使用。安全

4 反向代理負載均衡

什麼是反向代理負載均衡?

反向代理服務器是一個位於實際服務器以前的服務器,全部向咱們網站發來的請求都首先要通過反向代理服務器,服務器根據用戶的請求要麼直接將結果返回給用戶,要麼將請求交給後端服務器處理,再返回給用戶。

以前咱們介紹了用反向代理服務器實現靜態頁面和經常使用的動態頁面的緩存。接下來咱們介紹反向代理服務器更經常使用的功能——實現負載均衡。

咱們知道,全部發送給咱們網站的請求都首先通過反向代理服務器。那麼,反向代理服務器就能夠充當服務器集羣的調度者,它能夠根據當先後端服務器的負載狀況,將請求轉發給一臺合適的服務器,並將處理結果返回給用戶。

優勢

    隱藏後端服務器。
    與HTTP重定向相比,反向代理可以隱藏後端服務器,全部瀏覽器都不會與後端服務器直接交互,從而可以確保調度者的控制權,提高集羣的總體性能。
    故障轉移
    與DNS負載均衡相比,反向代理可以更快速地移除故障結點。當監控程序發現某一後端服務器出現故障時,可以及時通知反向代理服務器,並當即將其刪除。
    合理分配任務
    HTTP重定向和DNS負載均衡都沒法實現真正意義上的負載均衡,也就是調度服務器沒法根據後端服務器的實際負載狀況分配任務。但反向代理服務器支持手動設定每臺後端服務器的權重。咱們能夠根據服務器的配置設置不一樣的權重,權重的不一樣會致使被調度者選中的機率的不一樣。

缺點

    調度者壓力過大
    因爲全部的請求都先由反向代理服務器處理,那麼當請求量超過調度服務器的最大負載時,調度服務器的吞吐率下降會直接下降集羣的總體性能。
    制約擴展
    當後端服務器也沒法知足巨大的吞吐量時,就須要增長後端服務器的數量,可沒辦法無限量地增長,由於會受到調度服務器的最大吞吐量的制約。

粘滯會話

反向代理服務器會引發一個問題。若某臺後端服務器處理了用戶的請求,並保存了該用戶的session或存儲了緩存,那麼當該用戶再次發送請求時,沒法保證該請求仍然由保存了其Session或緩存的服務器處理,若由其餘服務器處理,先前的Session或緩存就找不到了。

解決辦法1:
能夠修改反向代理服務器的任務分配策略,以用戶IP做爲標識較爲合適。相同的用戶IP會交由同一臺後端服務器處理,從而就避免了粘滯會話的問題。

解決辦法2:
能夠在Cookie中標註請求的服務器ID,當再次提交請求時,調度者將該請求分配給Cookie中標註的服務器處理便可。

5 負載均衡組件

1.一、apache
—— 它是Apache軟件基金會的一個開放源代碼的跨平臺的網頁服務器,屬於老牌的web服務器了,支持基於Ip或者域名的虛擬主機,支持代理服務器,支持安全Socket層(SSL)等等,目前互聯網主要使用它作靜態資源服務器,也能夠作代理服務器轉發請求(如:圖片鏈等),結合tomcat等servlet容器處理jsp。

1.二、ngnix
—— 俄羅斯人開發的一個高性能的 HTTP和反向代理服務器。因爲Nginx 超越 Apache 的高性能和穩定性,使得國內使用 Nginx 做爲 Web 服務器的網站也愈來愈多,其中包括新浪博客、新浪播客、網易新聞、騰訊網、搜狐博客等門戶網站頻道等,在3w以上的高併發環境下,ngnix處理能力至關於apache的10倍。
參考:apache和tomcat的性能分析和對比(Nginx 0.8.x + PHP 5.2.13(FastCGI)搭建賽過Apache十倍的Web服務器(第6版)[原創])

1.三、lvs
—— Linux Virtual Server的簡寫,意即Linux虛擬服務器,是一個虛擬的服務器集羣系統。由畢業於國防科技大學的章文嵩博士於1998年5月創立,能夠實現LINUX平臺下的簡單負載均衡。瞭解更多,訪問官網:http://zh.linuxvirtualserver.org/。

1.四、HAProxy
—— HAProxy提供高可用性、負載均衡以及基於TCP和HTTP應用的代理,支持虛擬主機,它是免費、快速而且可靠的一種解決方案。HAProxy特別適用於那些負載特大的web站點, 這些站點一般又須要會話保持或七層處理。HAProxy運行在當前的硬件上,徹底能夠支持數以萬計的併發鏈接。而且它的運行模式使得它能夠很簡單安全的整合進您當前的架構中, 同時能夠保護你的web服務器不被暴露到網絡上.

1.五、keepalived
—— 這裏說的keepalived不是apache或者tomcat等某個組件上的屬性字段,它也是一個組件,能夠實現web服務器的高可用(HA high availably)。它能夠檢測web服務器的工做狀態,若是該服務器出現故障被檢測到,將其剔除服務器羣中,直至正常工做後,keepalive會自動檢測到並加入到服務器羣裏面。實現主備服務器發生故障時ip瞬時無縫交接。它是LVS集羣節點健康檢測的一個用戶空間守護進程,也是LVS的引導故障轉移模塊(director failover)。Keepalived守護進程能夠檢查LVS池的狀態。若是LVS服務器池當中的某一個服務器宕機了。keepalived會經過一 個setsockopt呼叫通知內核將這個節點從LVS拓撲圖中移除。

1.六、memcached
—— 它是一個高性能分佈式內存對象緩存系統。當初是Danga Interactive爲了LiveJournal快速發展開發的系統,用於對業務查詢數據緩存,減輕數據庫的負載。其守護進程(daemon)是用C寫的,可是客戶端支持幾乎全部語言(客戶端基本上有3種版本[memcache client for Java;spymemcached;xMecache]),服務端和客戶端經過簡單的協議通訊;在memcached裏面緩存的數據必須序列化。

1.七、terracotta—— 是一款由美國Terracotta公司開發的著名開源Java集羣平臺。它在JVM與Java應用之間實現了一個專門處理集羣功能的抽象層,容許用戶在不改變系統代碼的狀況下實現java應用的集羣。支持數據的持久化、session的複製以及高可用(HA)。

相關文章
相關標籤/搜索