Nginx 同 Apache 同樣都是一種 Web 服務器。基於 REST 架構風格,以統一資源描述符(Uniform Resources Identifier)URI 或者統一資源定位符(Uniform Resources Locator)URL 做爲溝通依據,經過 HTTP 協議提供各類網絡服務。算法
然而,這些服務器在設計之初受到當時環境的侷限,例如當時的用戶規模,網絡帶寬,產品特色等侷限而且各自的定位和發展都不盡相同。這也使得各個 Web 服務器有着各自鮮明的特色。後端
Apache 的發展時期很長,並且是毫無爭議的世界第一大服務器。它有着不少優勢:穩定、開源、跨平臺等等。瀏覽器
它出現的時間太長了,它興起的年代,互聯網產業遠遠比不上如今。因此它被設計爲一個重量級的。緩存
它不支持高併發的服務器。在 Apache 上運行數以萬計的併發訪問,會致使服務器消耗大量內存。安全
操做系統對其進行進程或線程間的切換也消耗了大量的 CPU 資源,致使 HTTP 請求的平均響應速度下降。服務器
這些都決定了 Apache 不可能成爲高性能 Web 服務器,輕量級高併發服務器 Nginx 就應運而生了。網絡
俄羅斯的工程師 Igor Sysoev,他在爲 Rambler Media 工做期間,使用 C 語言開發了 Nginx。架構
Nginx 做爲 Web 服務器一直爲 Rambler Media 提供出色而又穩定的服務。而後呢,Igor Sysoev 將 Nginx 代碼開源,而且賦予自由軟件許可證。併發
因爲如下這幾點,因此,Nginx 火了:負載均衡
Nginx 使用基於事件驅動架構,使得其能夠支持數以百萬級別的 TCP 鏈接。
高度的模塊化和自由軟件許可證使得第三方模塊層出不窮(這是個開源的時代啊)。
Nginx 是一個跨平臺服務器,能夠運行在 Linux、Windows、FreeBSD、Solaris、AIX、Mac OS 等操做系統上。
這些優秀的設計帶來的極大的穩定性。
Nginx 是一款自由的、開源的、高性能的 HTTP 服務器和反向代理服務器;同時也是一個 IMAP、POP三、SMTP 代理服務器。
Nginx 能夠做爲一個 HTTP 服務器進行網站的發佈處理,另外 Nginx 能夠做爲反向代理進行負載均衡的實現。
關於代理
說到代理,首先咱們要明確一個概念,所謂代理就是一個表明、一個渠道;此時就涉及到兩個角色,一個是被代理角色,一個是目標角色。
被代理角色經過這個代理訪問目標角色完成一些任務的過程稱爲代理操做過程;如同生活中的專賣店,客人到 adidas 專賣店買了一雙鞋,這個專賣店就是代理,被代理角色就是 adidas 廠家,目標角色就是用戶。
正向代理
說反向代理以前,咱們先看看正向代理,正向代理也是你們最常接觸到的代理模式,咱們會從兩個方面來講關於正向代理的處理模式,分別從軟件方面和生活方面來解釋一下什麼叫正向代理。
在現在的網絡環境下,咱們若是因爲技術須要要去訪問國外的某些網站,此時你會發現位於國外的某網站咱們經過瀏覽器是沒有辦法訪問的。
此時你們可能都會用一個操做 FQ 進行訪問,FQ 的方式主要是找到一個能夠訪問國外網站的代理服務器,咱們將請求發送給代理服務器,代理服務器去訪問國外的網站,而後將訪問到的數據傳遞給咱們!
上述這樣的代理模式稱爲正向代理,正向代理最大的特色是客戶端很是明確要訪問的服務器地址;服務器只清楚請求來自哪一個代理服務器,而不清楚來自哪一個具體的客戶端;正向代理模式屏蔽或者隱藏了真實客戶端信息。
來看個示意圖(我把客戶端和正向代理框在一塊,同屬於一個環境,後面我有介紹):
客戶端必須設置正向代理服務器,固然前提是要知道正向代理服務器的 IP 地址,還有代理程序的端口。
以下圖:
總結來講:正向代理,"它代理的是客戶端",是一個位於客戶端和原始服務器(Origin Server)之間的服務器,爲了從原始服務器取得內容,客戶端向代理髮送一個請求並指定目標(原始服務器)。
而後代理向原始服務器轉交請求並將得到的內容返回給客戶端。客戶端必需要進行一些特別的設置才能使用正向代理。
正向代理的用途:
訪問原來沒法訪問的資源,如 Google。
能夠作緩存,加速訪問資源。
對客戶端訪問受權,上網進行認證。
代理能夠記錄用戶訪問記錄(上網行爲管理),對外隱藏用戶信息。
反向代理
明白了什麼是正向代理,咱們繼續看關於反向代理的處理方式,舉例如我國的某寶網站,天天同時鏈接到網站的訪問人數已經爆表,單個服務器遠遠不能知足人民日益增加的購買慾望了。
此時就出現了一個你們耳熟能詳的名詞:分佈式部署;也就是經過部署多臺服務器來解決訪問人數限制的問題。
某寶網站中大部分功能也是直接使用 Nginx 進行反向代理實現的,而且經過封裝 Nginx 和其餘的組件以後起了個高大上的名字:Tengine。
有興趣的童鞋能夠訪問 Tengine 的官網查看具體的信息:
http://tengine.taobao.org/
那麼反向代理具體是經過什麼樣的方式實現的分佈式的集羣操做呢,咱們先看一個示意圖(我把服務器和反向代理框在一塊,同屬於一個環境,後面我有介紹):
經過上述的圖解你們就能夠看清楚了,多個客戶端給服務器發送的請求,Nginx 服務器接收到以後,按照必定的規則分發給了後端的業務處理服務器進行處理了。
此時請求的來源也就是客戶端是明確的,可是請求具體由哪臺服務器處理的並不明確了,Nginx 扮演的就是一個反向代理角色。
客戶端是無感知代理的存在的,反向代理對外都是透明的,訪問者並不知道本身訪問的是一個代理。由於客戶端不須要任何配置就能夠訪問。
反向代理,"它代理的是服務端",主要用於服務器集羣分佈式部署的狀況下,反向代理隱藏了服務器的信息。
反向代理的做用:
保證內網的安全,一般將反向代理做爲公網訪問地址,Web 服務器是內網。
負載均衡,經過反向代理服務器來優化網站的負載。
項目場景
一般狀況下,咱們在實際項目操做時,正向代理和反向代理頗有可能會存在同一個應用場景中,正向代理代理客戶端的請求去訪問目標服務器,目標服務器是一個反向代理服務器,反向代理了多臺真實的業務處理服務器。
具體的拓撲圖以下:
截了一張圖來講明正向代理和反向代理兩者之間的區別,以下圖:
圖解:
在正向代理中,Proxy 和 Client 同屬於一個 LAN(圖中方框內),隱藏了客戶端信息。
在反向代理中,Proxy 和 Server 同屬於一個 LAN(圖中方框內),隱藏了服務端信息。
實際上,Proxy 在兩種代理中作的事情都是替服務器代爲收發請求和響應,不過從結構上看正好左右互換了一下,因此把後出現的那種代理方式稱爲反向代理了。
負載均衡
咱們已經明確了所謂代理服務器的概念,那麼接下來,Nginx 扮演了反向代理服務器的角色,它是依據什麼樣的規則進行請求分發的呢?不用的項目應用場景,分發的規則是否能夠控制呢?
這裏提到的客戶端發送的、Nginx 反向代理服務器接收到的請求數量,就是咱們說的負載量。
請求數量按照必定的規則進行分發,到不一樣的服務器處理的規則,就是一種均衡規則。
因此將服務器接收到的請求按照規則分發的過程,稱爲負載均衡。
負載均衡在實際項目操做過程當中,有硬件負載均衡和軟件負載均衡兩種,硬件負載均衡也稱爲硬負載,如 F5 負載均衡,相對造價昂貴成本較高。
可是數據的穩定性安全性等等有很是好的保障,如中國移動中國聯通這樣的公司纔會選擇硬負載進行操做。
更多的公司考慮到成本緣由,會選擇使用軟件負載均衡,軟件負載均衡是利用現有的技術結合主機硬件實現的一種消息隊列分發機制。
Nginx 支持的負載均衡調度算法方式以下:
①weight 輪詢(默認):接收到的請求按照順序逐一分配到不一樣的後端服務器,即便在使用過程當中,某一臺後端服務器宕機,Nginx 會自動將該服務器剔除出隊列,請求受理狀況不會受到任何影響。
這種方式下,能夠給不一樣的後端服務器設置一個權重值(weight),用於調整不一樣的服務器上請求的分配率。
權重數據越大,被分配到請求的概率越大;該權重值,主要是針對實際工做環境中不一樣的後端服務器硬件配置進行調整的。
②ip_hash:每一個請求按照發起客戶端的 ip 的 hash 結果進行匹配,這樣的算法下一個固定 ip 地址的客戶端總會訪問到同一個後端服務器,這也在必定程度上解決了集羣部署環境下 Session 共享的問題。
③fair:智能調整調度算法,動態的根據後端服務器的請求處理到響應的時間進行均衡分配。
響應時間短處理效率高的服務器分配到請求的機率高,響應時間長處理效率低的服務器分配到的請求少,它是結合了前二者的優勢的一種調度算法。
可是須要注意的是 Nginx 默認不支持 fair 算法,若是要使用這種調度算法,請安裝 upstream_fair 模塊。
④url_hash:按照訪問的 URL 的 hash 結果分配請求,每一個請求的 URL 會指向後端固定的某個服務器,能夠在 Nginx 做爲靜態服務器的狀況下提升緩存效率。
一樣要注意 Nginx 默認不支持這種調度算法,要使用的話須要安裝 Nginx 的 hash 軟件包。
幾種經常使用 Web 服務器對好比下圖: