Nginx 以其高性能,穩定性,豐富的功能,簡單的配置和低資源消耗而聞名。本文從底層原理分析 Nginx 爲何這麼快!html
Nginx 服務器,正常運行過程當中:nginx
思考:算法
請求是鏈接到 Nginx,Master 進程負責處理和轉發?spring
如何選定哪一個 Worker 進程處理請求?請求的處理結果,是否還要通過 Master 進程?後端
HTTP 鏈接創建和請求處理過程設計模式
以下:數組
Nginx 啓動時,Master 進程,加載配置文件。服務器
Master 進程,初始化監聽的 Socket。網絡
Master 進程,Fork 出多個 Worker 進程。數據結構
Worker 進程,競爭新的鏈接,獲勝方經過三次握手,創建 Socket 鏈接,並處理請求。
Nginx 爲何擁有高性能而且可以支撐高併發?
Nginx 採用多進程+異步非阻塞方式(IO 多路複用 Epoll)。
請求的完整過程:創建鏈接→讀取請求→解析請求→處理請求→響應請求。
請求的完整過程對應到底層就是:讀寫 Socket 事件。
Request:Nginx 中 HTTP 請求。
基本的 HTTP Web Server 工做模式:
Nginx 也是這個套路,總體流程一致:
模塊化體系結構
Nginx 的模塊根據其功能基本上能夠分爲如下幾種類型:
①event module:搭建了獨立於操做系統的事件處理機制的框架,及提供了各具體事件的處理。包括 ngx_events_module,ngx_event_core_module 和 ngx_epoll_module 等。
Nginx 具體使用何種事件處理模塊,這依賴於具體的操做系統和編譯選項。
②phase handler:此類型的模塊也被直接稱爲 handler 模塊。主要負責處理客戶端請求併產生待響應內容,好比 ngx_http_static_module 模塊,負責客戶端的靜態頁面請求處理並將對應的磁盤文件準備爲響應內容輸出。
③output filter:也稱爲 filter 模塊,主要是負責對輸出的內容進行處理,能夠對輸出進行修改。
例如,能夠實現對輸出的全部 html 頁面增長預約義的 footbar 一類的工做,或者對輸出的圖片的 URL 進行替換之類的工做。
④upstream:upstream 模塊實現反向代理的功能,將真正的請求轉發到後端服務器上,並從後端服務器上讀取響應,發回客戶端。
upstream 模塊是一種特殊的 handler,只不過響應內容不是真正由本身產生的,而是從後端服務器上讀取的。
⑤load-balancer:負載均衡模塊,實現特定的算法,在衆多的後端服務器中,選擇一個服務器出來做爲某個請求的轉發服務器。
1)Nginx vs Apache
Nginx:
2)Apache:
3)Nginx 最大鏈接數
基礎背景:
Nginx 是多進程模型,Worker 進程用於處理請求。
單個進程的鏈接數(文件描述符 fd),有上限(nofile):ulimit -n。
Nginx 上配置單個 Worker 進程的最大鏈接數:worker_connections 上限爲 nofile。
Nginx 上配置 Worker 進程的數量:worker_processes。
所以,Nginx 的最大鏈接數:
Nginx 的最大鏈接數:Worker 進程數量 x 單個 Worker 進程的最大鏈接數。
上面是 Nginx 做爲通用服務器時,最大的鏈接數。
Nginx 做爲反向代理服務器時,可以服務的最大鏈接數:(Worker 進程數量 x 單個 Worker 進程的最大鏈接數)/ 2。
Nginx 反向代理時,會創建 Client 的鏈接和後端 Web Server 的鏈接,佔用 2 個鏈接。
思考:
每打開一個 Socket 佔用一個 fd?
爲何,一個進程可以打開的 fd 數量有限制?
4)HTTP 請求和響應
HTTP 請求:
HTTP 響應:
5)IO 模型
處理多個請求時,能夠採用:IO 多路複用或者阻塞 IO+多線程:
IO 多路複用:一個線程,跟蹤多個 Socket 狀態,哪一個就緒,就讀寫哪一個。
阻塞 IO+多線程:每個請求,新建一個服務線程。
IO 多路複用和多線程的適用場景?
IO 多路複用:單個鏈接的請求處理速度沒有優點。
大併發量:只使用一個線程,處理大量的併發請求,下降上下文環境切換損耗,也不須要考慮併發問題,相對能夠處理更多的請求。
消耗更少的系統資源(不須要線程調度開銷)。
適用於長鏈接的狀況(多線程模式長鏈接容易形成線程過多,形成頻繁調度)。
阻塞 IO +多線程:實現簡單,能夠不依賴系統調用。
每一個線程,都須要時間和空間。
線程數量增加時,線程調度開銷指數增加。
6)select/poll 和 epoll 比較以下:
select/poll 系統調用: // select 系統調用 int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout); // poll 系統調用 int poll(struct pollfd fds[], nfds_t nfds, int timeout);
select:
查詢 fd_set 中,是否有就緒的 fd,能夠設定一個超時時間,當有 fd (File descripter) 就緒或超時返回。
fd_set 是一個位集合,大小是在編譯內核時的常量,默認大小爲 1024。
特色:鏈接數限制,fd_set 可表示的 fd 數量過小了;線性掃描:判斷 fd 是否就緒,須要遍歷一邊 fd_set;數據複製:用戶空間和內核空間,複製鏈接就緒狀態信息。
poll:
epoll,event 事件驅動:
select,poll,epoll:
I/O 多路複用的機制。
I/O 多路複用就經過一種機制,能夠監視多個描述符,一旦某個描述符就緒(通常是讀就緒或者寫就緒),可以通知程序進行相應的讀寫操做;監視多個文件描述符。
但 select,poll,epoll 本質上都是同步 I/O:用戶進程負責讀寫(從內核空間拷貝到用戶空間),讀寫過程當中,用戶進程是阻塞的;異步 IO,無需用戶進程負責讀寫,異步 IO,會負責從內核空間拷貝到用戶空間。
7)Nginx 的併發處理能力
關於 Nginx 的併發處理能力:併發鏈接數,通常優化後,峯值能保持在 1~3w 左右。(內存和 CPU 核心數不一樣,會有進一步優化空間)。
原文連接:
https://blog.51cto.com/144559...
文源網絡,僅供學習之用,若有侵權,聯繫刪除。我將優質的技術文章和經驗總結都聚集在了個人公衆號【Java圈子】裏。
爲方便你們學習,我整理了一套學習資料,涵蓋Java虛擬機、spring框架、Java線程、數據結構、設計模式等等,免費提供給熱愛Java的同窗! 更有學習交流羣,多交流問題才能更快進步~