負載均衡用於從「upstream」模塊定義的後端服務器列表中選取一臺服務器接受用戶的請求。一個最基本的upstream模塊是這樣的,模塊內的server是服務器列表:html
#動態服務器組 upstream dynamic_zuoyu { server localhost:8080; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082; #tomcat 8.5 server localhost:8083; #tomcat 9.0 }
在upstream模塊配置完成後,要讓指定的訪問反向代理到服務器列表:nginx
#其餘頁面反向代理到tomcat容器 location ~ .*$ { index index.jsp index.html; proxy_pass http://dynamic_zuoyu; }
這就是最基本的負載均衡實例,但這不足以知足實際需求;目前Nginx服務器的upstream模塊支持6種方式的分配:算法
輪詢 | 默認方式 |
weight | 權重方式 |
ip_hash | 依據ip分配方式 |
least_conn | 最少鏈接方式 |
fair(第三方) | 響應時間方式 |
url_hash(第三方) | 依據URL分配方式 |
在這裏,只詳細說明Nginx自帶的負載均衡策略,第三方很少描述。後端
最基本的配置方法,上面的例子就是輪詢的方式,它是upstream模塊默認的負載均衡默認策略。每一個請求會按時間順序逐一分配到不一樣的後端服務器。緩存
有以下參數:tomcat
fail_timeout | 與max_fails結合使用。 |
max_fails | 設置在fail_timeout參數設置的時間內最大失敗次數,若是在這個時間內,全部針對該服務器的請求都失敗了,那麼認爲該服務器會被認爲是停機了,服務器 |
fail_time | 服務器會被認爲停機的時間長度,默認爲10s。 |
backup | 標記該服務器爲備用服務器。當主服務器中止時,請求會被髮送到它這裏。 |
down | 標記服務器永久停機了。 |
注意:session
權重方式,在輪詢策略的基礎上指定輪詢的概率。例子以下:負載均衡
#動態服務器組 upstream dynamic_zuoyu { server localhost:8080 weight=2; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082 backup; #tomcat 8.5 server localhost:8083 max_fails=3 fail_timeout=20s; #tomcat 9.0 }
在該例子中,weight參數用於指定輪詢概率,weight的默認值爲1,;weight的數值與訪問比率成正比,好比Tomcat 7.0被訪問的概率爲其餘服務器的兩倍。jsp
注意:
指定負載均衡器按照基於客戶端IP的分配方式,這個方法確保了相同的客戶端的請求一直髮送到相同的服務器,以保證session會話。這樣每一個訪客都固定訪問一個後端服務器,能夠解決session不能跨服務器的問題。
#動態服務器組 upstream dynamic_zuoyu { ip_hash; #保證每一個訪客固定訪問一個後端服務器 server localhost:8080 weight=2; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082; #tomcat 8.5 server localhost:8083 max_fails=3 fail_timeout=20s; #tomcat 9.0 }
注意:
把請求轉發給鏈接數較少的後端服務器。輪詢算法是把請求平均的轉發給各個後端,使它們的負載大體相同;可是,有些請求佔用的時間很長,會致使其所在的後端負載較高。這種狀況下,least_conn這種方式就能夠達到更好的負載均衡效果。
#動態服務器組 upstream dynamic_zuoyu { least_conn; #把請求轉發給鏈接數較少的後端服務器 server localhost:8080 weight=2; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082 backup; #tomcat 8.5 server localhost:8083 max_fails=3 fail_timeout=20s; #tomcat 9.0 }
注意:
第三方的負載均衡策略的實現須要安裝第三方插件。
按照服務器端的響應時間來分配請求,響應時間短的優先分配。
#動態服務器組 upstream dynamic_zuoyu { server localhost:8080; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082; #tomcat 8.5 server localhost:8083; #tomcat 9.0 fair; #實現響應時間短的優先分配 }
按訪問url的hash結果來分配請求,使每一個url定向到同一個後端服務器,要配合緩存命中來使用。同一個資源屢次請求,可能會到達不一樣的服務器上,致使沒必要要的屢次下載,緩存命中率不高,以及一些資源時間的浪費。而使用url_hash,可使得同一個url(也就是同一個資源請求)會到達同一臺服務器,一旦緩存住了資源,再此收到請求,就能夠從緩存中讀取。
#動態服務器組 upstream dynamic_zuoyu { hash $request_uri; #實現每一個url定向到同一個後端服務器 server localhost:8080; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082; #tomcat 8.5 server localhost:8083; #tomcat 9.0 }
以上即是6種負載均衡策略的實現方式,其中除了輪詢和輪詢權重外,都是Nginx根據不一樣的算法實現的。在實際運用中,須要根據不一樣的場景選擇性運用,大都是多種策略結合使用以達到實際需求。