週末晚上,和女友去電影院,準備看晚上的DC的海底動做冒險電影——海王。在入口處,人不少,有幾個引導人員時不時的指揮觀衆從不一樣的入口進入影院內。咱們站在隊伍的尾端。算法
Load balancing,即負載均衡,是一種計算機技術,用來在多個計算機(計算機集羣)、網絡鏈接、CPU、磁盤驅動器或其餘資源中分配負載,以達到最優化資源使用、最大化吞吐率、最小化響應時間、同時避免過載的目的。瀏覽器
咱們在平常生活中常常免不了要去一些比較擁擠的地方,好比地鐵站、火車站、電影院、銀行等。其實,根據咱們的經驗,不管是買票,仍是排隊入場,這些場所通常都會設置多個服務點或者入口的。緩存
可是,若是沒有人引導的話,大多數狀況下,最近的入口會擠滿人。而哪些距離較遠的服務點或者入口就寬鬆不少。服務器
這種狀況下,就會大大浪費資源,由於若是能夠把這些排隊的人很好的分散到各個入口的話會大大縮短排隊時間。markdown
其實,網站的建設也是同樣的。咱們在《如何給女友介紹什麼是分佈式》中提到過,爲了提高網站的服務能力,不少網站採用集羣部署,就像話劇院有多個入口同樣。網絡
而當用戶集中訪問網站的時候,若是沒有任何機制來疏導用戶的話,徹底隨機或者就近原則的話,那麼就會致使某些服務器的流量很大,而另一個服務器的qps很小。這不只嚴重的浪費了資源,並且還會致使拉長用戶訪問網站的RT,影響用戶的體驗。更嚴重的可能直接拖垮那些流量大的服務器。負載均衡
這時候,就須要一個協調者,來均衡的分配這些用戶的請求,可讓用戶的能夠均勻的分派到不一樣的服務器上。分佈式
在《如何給女友介紹什麼是分佈式》中,咱們說過,爲了提高飯店的服務能力,飯店可能會僱傭多個廚師,而這些廚師就組成了一個廚師集羣。而當用戶在店內點菜的時候,就須要一個專業人員可以把全部客戶的菜單均勻的分配給店內的廚師。這樣才能最大程度的提高飯店的服務能力。工具
前面提到過了,爲了提高網站的各方面能力,咱們通常會把多臺機器組成一個集羣對外提供服務。然而,咱們的網站對外提供的訪問入口都是一個的,好比www.taobao.com。那麼當用戶在瀏覽器輸入www.taobao.com的時候如何將用戶的請求分發到集羣中不一樣的機器上呢,這就是負載均衡在作的事情。oop
想要實現負載均衡,其實有不少種作法,在深刻介紹負載均衡以前,要先介紹一個概念,那就是OSI七層模型。
OSI是一個開放性的通訊系統互連參考模型,他是一個定義得很是好的協議規範。
OSI模型有7層結構,每層均可以有幾個子層。 OSI的7層從上到下分別是 七、應用層;六、表示層;五、會話層;四、傳輸層;三、網絡層;二、數據鏈路層;一、物理層;
其中高層(即七、六、五、4層)定義了應用程序的功能,下面3層(即三、二、1層)主要面向經過網絡的端到端的數據流。
在這七層模型種,高層次都是依賴於低層次的。層次越高,使用起來越方便。
telnet、HTTP、FTP、NFS、SMTP、DNS等屬於第七層應用層的概念。
TCP、UDP、SPX等屬於第四層傳輸層的概念。
IP、IPX等屬於第三層網絡層的概念。
ATM、FDDI等屬於第二層數據鏈路層的概念。
瞭解了網絡協議的七層模型之後,再來看看負載均衡。咱們能夠很明確的一點是,負載均衡是要在網絡傳輸中作文章的。而要在網絡傳輸過程搞事情,那麼這七層模型就勢必躲不開。
因此,根據負載均衡技術實如今OSI七層模型的不一樣層次,是能夠給負載均衡分類的。
常見的實現方式中,主要能夠在應用層、傳輸層、網絡層和數據傳輸層作文章。因此,工做在應用層的負載均衡,咱們一般稱之爲七層負載均衡、工做在傳輸層的咱們稱之爲四層負載均衡。
大體能夠分爲如下幾種,其中最經常使用的是四層和七層負載均衡:
二層負載均衡
負載均衡服務器對外依然提供一個VIP(虛IP),集羣中不一樣的機器採用相同IP地址,可是機器的MAC地址不同。當負載均衡服務器接受到請求以後,經過改寫報文的目標MAC地址的方式將請求轉發到目標機器實現負載均衡。
三層負載均衡
和二層負載均衡相似,負載均衡服務器對外依然提供一個VIP(虛IP),可是集羣中不一樣的機器採用不一樣的IP地址。當負載均衡服務器接受到請求以後,根據不一樣的負載均衡算法,經過IP將請求轉發至不一樣的真實服務器。
四層負載均衡
四層負載均衡工做在OSI模型的傳輸層,因爲在傳輸層,只有TCP/UDP協議,這兩種協議中除了包含源IP、目標IP之外,還包含源端口號及目的端口號。四層負載均衡服務器在接受到客戶端請求後,之後經過修改數據包的地址信息(IP+端口號)將流量轉發到應用服務器。
七層負載均衡
七層負載均衡工做在OSI模型的應用層,應用層協議較多,經常使用http、radius、dns等。七層負載就能夠基於這些協議來負載。這些應用層協議中會包含不少有意義的內容。好比同一個Web服務器的負載均衡,除了根據IP加端口進行負載外,還可根據七層的URL、瀏覽器類別、語言來決定是否要進行負載均衡。
市面上有不少開源的負載均衡的工具或軟件,基本都是基於前面提到的方案實現的,大多數是工做在第七層和第四層的。Nginx/LVS/HAProxy是目前使用最普遍的三種負載均衡軟件。
LVS
LVS(Linux Virtual Server),也就是Linux虛擬服務器, 是一個由章文嵩博士發起的自由軟件項目。使用LVS技術要達到的目標是:經過LVS提供的負載均衡技術和Linux操做系統實現一個高性能、高可用的服務器羣集,它具備良好可靠性、可擴展性和可操做性。從而以低廉的成本實現最優的服務性能。
LVS主要用來作四層負載均衡。
Nginx
Nginx(發音同engine x)是一個網頁服務器,它能反向代理HTTP, HTTPS, SMTP, POP3, IMAP的協議連接,以及一個負載均衡器和一個HTTP緩存。
Nginx主要用來作七層負載均衡。
HAProxy
HAProxy是一個使用C語言編寫的自由及開放源代碼軟件,其提供高可用性、負載均衡,以及基於TCP和HTTP的應用程序代理。
HAProxy主要用來作七層負載均衡。
負載均衡服務器在決定將請求轉發到具體哪臺真實服務器的時候,是經過負載均衡算法來實現的。負載均衡算法,是一個負載均衡服務器的核心。
就像電影院門口的引導員同樣,他根據什麼把排隊人員分配到具體的入口呢?是哪一個入口人少嗎?仍是哪一個入口速度最快?仍是哪一個入口最近呢?若是來了一個VIP怎麼辦呢?
負載均衡算法能夠分爲兩類:靜態負載均衡算法和動態負載均衡算法。
靜態負載均衡算法包括:輪詢,比率,優先權
動態負載均衡算法包括: 最少鏈接數,最快響應速度,觀察方法,預測法,動態性能分配,動態服務器補充,服務質量,服務類型,規則模式。
輪詢(Round Robin):順序循環將請求一次順序循環地鏈接每一個服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP 就把其從順序循環隊列中拿出,不參加下一次的輪詢,直到其恢復正常。
比率(Ratio):給每一個服務器分配一個加權值爲比例,根椐這個比例,把用戶的請求分配到每一個服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP 就把其從服務器隊列中拿出,不參加下一次的用戶請求的分配, 直到其恢復正常。
優先權(Priority):給全部服務器分組,給每一個組定義優先權,BIG-IP 用戶的請求,分配給優先級最高的服務器組(在同一組內,採用輪詢或比率算法,分配用戶的請求);當最高優先級中全部服務器出現故障,BIG-IP 纔將請求送給次優先級的服務器組。這種方式,實際爲用戶提供一種熱備份的方式。
最少的鏈接方式(Least Connection):傳遞新的鏈接給那些進行最少鏈接處理的服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP 就把其從服務器隊列中拿出,不參加下一次的用戶請求的分配, 直到其恢復正常。
最快模式(Fastest):傳遞鏈接給那些響應最快的服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP 就把其從服務器隊列中拿出,不參加下一次的用戶請求的分配,直到其恢復正常。
觀察模式(Observed):鏈接數目和響應時間以這兩項的最佳平衡爲依據爲新的請求選擇服務器。當其中某個服務器發生第二到第7 層的故障,BIG-IP就把其從服務器隊列中拿出,不參加下一次的用戶請求的分配,直到其恢復正常。
預測模式(Predictive):BIG-IP利用收集到的服務器當前的性能指標,進行預測分析,選擇一臺服務器在下一個時間片內,其性能將達到最佳的服務器相應用戶的請求。(被BIG-IP 進行檢測)
動態性能分配(Dynamic Ratio-APM):BIG-IP 收集到的應用程序和應用服務器的各項性能參數,動態調整流量分配。
動態服務器補充(Dynamic Server Act.):當主服務器羣中因故障致使數量減小時,動態地將備份服務器補充至主服務器羣。
服務質量(QoS):按不一樣的優先級對數據流進行分配。
服務類型(ToS): 按不一樣的服務類型(在Type of Field中標識)負載均衡對數據流進行分配。
規則模式:針對不一樣的數據流設置導向規則,用戶可自行。
以上,就是目前實現負載均衡的主流算法。不一樣的負載均衡服務器會選擇不一樣的算法。就像電影院和火車站可能會選用不一樣的引導策略同樣。火車站可能會把行李少的旅客分配到一個專門的入口,可能給即將發車的旅客分派到特快入口,手持可掃描車票的用戶單獨分配到特殊入口等。