Tomcat 的鏈接數與線程池

前言

在使用tomcat時,常常會遇到鏈接數、線程數之類的配置問題,要真正理解這些概念,必須先了解Tomcat的鏈接器(Connector)。html

在前面的文章 詳解Tomcat配置文件server.xml 中寫到過:Connector的主要功能,是接收鏈接請求,建立Request和Response對象用於和請求端交換數據;而後分配線程讓Engine(也就是Servlet容器)來處理這個請求,並把產生的Request和Response對象傳給Engine。當Engine處理完請求後,也會經過Connector將響應返回給客戶端。linux

能夠說,Servlet容器處理請求,是須要Connector進行調度和控制的,Connector是Tomcat處理請求的主幹,所以Connector的配置和使用對Tomcat的性能有着重要的影響。這篇文章將從Connector入手,討論一些與Connector有關的重要問題,包括NIO/BIO模式、線程池、鏈接數等。數據庫

根據協議的不一樣,Connector能夠分爲HTTP Connector、AJP Connector等,本文只討論HTTP Connector。apache

1、Nio、Bio、APR

一、Connector的protocol

Connector在處理HTTP請求時,會使用不一樣的protocol。不一樣的Tomcat版本支持的protocol不一樣,其中最典型的protocol包括BIO、NIO和APR(Tomcat7中支持這3種,Tomcat8增長了對NIO2的支持,而到了Tomcat8.5和Tomcat9.0,則去掉了對BIO的支持)。windows

BIO是Blocking IO,顧名思義是阻塞的IO;NIO是Non-blocking IO,則是非阻塞的IO。而APR是Apache Portable Runtime,是Apache可移植運行庫,利用本地庫能夠實現高可擴展性、高性能;Apr是在Tomcat上運行高併發應用的首選模式,可是須要安裝apr、apr-utils、tomcat-native等包。tomcat

二、如何指定protocol

Connector使用哪一種protocol,能夠經過<connector>元素中的protocol屬性進行指定,也可使用默認值。服務器

指定的protocol取值及對應的協議以下:多線程

  • HTTP/1.1:默認值,使用的協議與Tomcat版本有關
  • org.apache.coyote.http11.Http11Protocol:BIO
  • org.apache.coyote.http11.Http11NioProtocol:NIO
  • org.apache.coyote.http11.Http11Nio2Protocol:NIO2
  • org.apache.coyote.http11.Http11AprProtocol:APR

若是沒有指定protocol,則使用默認值HTTP/1.1,其含義以下:在Tomcat7中,自動選取使用BIO或APR(若是找到APR須要的本地庫,則使用APR,不然使用BIO);在Tomcat8中,自動選取使用NIO或APR(若是找到APR須要的本地庫,則使用APR,不然使用NIO)。併發

三、BIO/NIO有何不一樣

不管是BIO,仍是NIO,Connector處理請求的大體流程是同樣的:socket

在accept隊列中接收鏈接(當客戶端向服務器發送請求時,若是客戶端與OS完成三次握手創建了鏈接,則OS將該鏈接放入accept隊列);在鏈接中獲取請求的數據,生成request;調用servlet容器處理請求;返回response。爲了便於後面的說明,首先明確一下鏈接與請求的關係:鏈接是TCP層面的(傳輸層),對應socket;請求是HTTP層面的(應用層),必須依賴於TCP的鏈接實現;一個TCP鏈接中可能傳輸多個HTTP請求。

在BIO實現的Connector中,處理請求的主要實體是JIoEndpoint對象。JIoEndpoint維護了Acceptor和Worker:Acceptor接收socket,而後從Worker線程池中找出空閒的線程處理socket,若是worker線程池沒有空閒線程,則Acceptor將阻塞。其中Worker是Tomcat自帶的線程池,若是經過<Executor>配置了其餘線程池,原理與Worker相似。

在NIO實現的Connector中,處理請求的主要實體是NIoEndpoint對象。NIoEndpoint中除了包含Acceptor和Worker外,仍是用了Poller,處理流程以下圖所示(圖片來源:http://gearever.iteye.com/blog/1844203)。

Acceptor接收socket後,不是直接使用Worker中的線程處理請求,而是先將請求發送給了Poller,而Poller是實現NIO的關鍵。Acceptor向Poller發送請求經過隊列實現,使用了典型的生產者-消費者模式。在Poller中,維護了一個Selector對象;當Poller從隊列中取出socket後,註冊到該Selector中;而後經過遍歷Selector,找出其中可讀的socket,並使用Worker中的線程處理相應請求。與BIO相似,Worker也能夠被自定義的線程池代替。

經過上述過程能夠看出,在NIoEndpoint處理請求的過程當中,不管是Acceptor接收socket,仍是線程處理請求,使用的仍然是阻塞方式;但在「讀取socket並交給Worker中的線程」的這個過程當中,使用非阻塞的NIO實現,這是NIO模式與BIO模式的最主要區別(其餘區別對性能影響較小,暫時略去不提)。而這個區別,在併發量較大的情形下能夠帶來Tomcat效率的顯著提高:

目前大多數HTTP請求使用的是長鏈接(HTTP/1.1默認keep-alive爲true),而長鏈接意味着,一個TCP的socket在當前請求結束後,若是沒有新的請求到來,socket不會立馬釋放,而是等timeout後再釋放。若是使用BIO,「讀取socket並交給Worker中的線程」這個過程是阻塞的,也就意味着在socket等待下一個請求或等待釋放的過程當中,處理這個socket的工做線程會一直被佔用,沒法釋放;所以Tomcat能夠同

時處理的socket數目不能超過最大線程數,性能受到了極大限制。而使用NIO,「讀取socket並交給Worker中的線程」這個過程是非阻塞的,當socket在等待下一個請求或等待釋放時,並不會佔用工做線程,所以Tomcat能夠同時處理的socket數目遠大於最大線程數,併發性能大大提升。

2、3個參數:acceptCount、maxConnections、maxThreads

再回顧一下Tomcat處理請求的過程:在accept隊列中接收鏈接(當客戶端向服務器發送請求時,若是客戶端與OS完成三次握手創建了鏈接,則OS將該鏈接放入accept隊列);在鏈接中獲取請求的數據,生成request;調用servlet容器處理請求;返回response。

相對應的,Connector中的幾個參數功能以下:

一、acceptCount

accept隊列的長度;當accept隊列中鏈接的個數達到acceptCount時,隊列滿,進來的請求一概被拒絕。默認值是100。

二、maxConnections

Tomcat在任意時刻接收和處理的最大鏈接數。當Tomcat接收的鏈接數達到maxConnections時,Acceptor線程不會讀取accept隊列中的鏈接;這時accept隊列中的線程會一直阻塞着,直到Tomcat接收的鏈接數小於maxConnections。若是設置爲-1,則鏈接數不受限制。

默認值與鏈接器使用的協議有關:NIO的默認值是10000,APR/native的默認值是8192,而BIO的默認值爲maxThreads(若是配置了Executor,則默認值是Executor的maxThreads)。

在windows下,APR/native的maxConnections值會自動調整爲設置值如下最大的1024的整數倍;如設置爲2000,則最大值實際是1024。

三、maxThreads

請求處理線程的最大數量。默認值是200(Tomcat7和8都是的)。若是該Connector綁定了Executor,這個值會被忽略,由於該Connector將使用綁定的Executor,而不是內置的線程池來執行任務。

maxThreads規定的是最大的線程數目,並非實際running的CPU數量;實際上,maxThreads的大小比CPU核心數量要大得多。這是由於,處理請求的線程真正用於計算的時間可能不多,大多數時間可能在阻塞,如等待數據庫返回數據、等待硬盤讀寫數據等。所以,在某一時刻,只有少數的線程真正的在使用物理CPU,大多數線程都在等待;所以線程數遠大於物理核心數纔是合理的。

換句話說,Tomcat經過使用比CPU核心數量多得多的線程數,可使CPU忙碌起來,大大提升CPU的利用率。

四、參數設置

(1)maxThreads的設置既與應用的特色有關,也與服務器的CPU核心數量有關。經過前面介紹能夠知道,maxThreads數量應該遠大於CPU核心數量;並且CPU核心數越大,maxThreads應該越大;應用中CPU越不密集(IO越密集),maxThreads應該越大,以便可以充分利用CPU。固然,maxThreads的值並非越大越好,若是maxThreads過大,那麼CPU會花費大量的時間用於線程的切換,總體效率會下降。

(2)maxConnections的設置與Tomcat的運行模式有關。若是tomcat使用的是BIO,那麼maxConnections的值應該與maxThreads一致;若是tomcat使用的是NIO,那麼相似於Tomcat的默認值,maxConnections值應該遠大於maxThreads。

(3)經過前面的介紹能夠知道,雖然tomcat同時能夠處理的鏈接數目是maxConnections,但服務器中能夠同時接收的鏈接數爲maxConnections+acceptCount 。acceptCount的設置,與應用在鏈接太高狀況下但願作出什麼反應有關係。若是設置過大,後面進入的請求等待時間會很長;若是設置太小,後面進入的請求立馬返回connection refused。

3、線程池Executor

Executor元素表明Tomcat中的線程池,能夠由其餘組件共享使用;要使用該線程池,組件須要經過executor屬性指定該線程池。

Executor是Service元素的內嵌元素。通常來講,使用線程池的是Connector組件;爲了使Connector能使用線程池,Executor元素應該放在Connector前面。Executor與Connector的配置舉例以下:

<Executor name="tomcatThreadPool" namePrefix ="catalina-exec-" maxThreads="150" minSpareThreads="4" />

<Connector executor="tomcatThreadPool" port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" acceptCount="1000" />

Executor的主要屬性包括:

  • name:該線程池的標記
  • maxThreads:線程池中最大活躍線程數,默認值200(Tomcat7和8都是)
  • minSpareThreads:線程池中保持的最小線程數,最小值是25
  • maxIdleTime:線程空閒的最大時間,當空閒超過該值時關閉線程(除非線程數小於minSpareThreads),單位是ms,默認值60000(1分鐘)
  • daemon:是否後臺線程,默認值true
  • threadPriority:線程優先級,默認值5
  • namePrefix:線程名字的前綴,線程池中線程名字爲:namePrefix+線程編號
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443"
maxThreads="800" acceptCount="1000"/>

tomcate -->config --> server.xml

 

其中最後兩個參數意義以下:

maxThreads:tomcat起動的最大線程數,即同時處理的任務個數,默認值爲200

acceptCount:當tomcat起動的線程數達到最大時,接受排隊的請求個數,默認值爲100

 

這兩個值如何起做用,請看下面三種狀況

狀況1:接受一個請求,此時tomcat起動的線程數沒有到達maxThreads,tomcat會起動一個線程來處理此請求。

狀況2:接受一個請求,此時tomcat起動的線程數已經到達maxThreads,tomcat會把此請求放入等待隊列,等待空閒線程。

狀況3:接受一個請求,此時tomcat起動的線程數已經到達maxThreads,等待隊列中的請求個數也達到了acceptCount,此時tomcat會直接拒絕這次請求,返回connection refused

maxThreads如何配置

通常的服務器操做都包括量方面:1計算(主要消耗cpu),2等待(io、數據庫等)

第一種極端狀況,若是咱們的操做是純粹的計算,那麼系統響應時間的主要限制就是cpu的運算能力,此時maxThreads應該儘可能設的小,下降同一時間內爭搶cpu的線程個數,能夠提升計算效率,提升系統的總體處理能力。

第二種極端狀況,若是咱們的操做純粹是IO或者數據庫,那麼響應時間的主要限制就變爲等待外部資源,此時maxThreads應該儘可能設的大,這樣才能提升同時處理請求的個數,從而提升系統總體的處理能力。此狀況下由於tomcat同時處理的請求量會比較大,因此須要關注一下tomcat的虛擬機內存設置和linux的open file限制。

我在測試時遇到一個問題,maxThreads我設置的比較大好比3000,當服務的線程數大到必定程度時,通常是2000出頭,單次請求的響應時間就會急劇的增長,

百思不得其解這是爲何,四處尋求答案無果,最後我總結的緣由多是cpu在線程切換時消耗的時間隨着線程數量的增長愈來愈大,

cpu把大多數時間都用來在這2000多個線程直接切換上了,固然cpu就沒有時間來處理咱們的程序了。

之前一直簡單的認爲多線程=高效率。。其實多線程自己並不能提升cpu效率,線程過多反而會下降cpu效率。

當cpu核心數<線程數時,cpu就須要在多個線程直接來回切換,以保證每一個線程都會得到cpu時間,即一般咱們說的併發執行。

因此maxThreads的配置絕對不是越大越好。

現實應用中,咱們的操做都會包含以上兩種類型(計算、等待),因此maxThreads的配置並無一個最優值,必定要根據具體狀況來配置。

最好的作法是:在不斷測試的基礎上,不斷調整、優化,才能獲得最合理的配置。

acceptCount的配置,我通常是設置的跟maxThreads同樣大,這個值應該是主要根據應用的訪問峯值與平均值來權衡配置的。

若是設的較小,能夠保證接受的請求較快相應,可是超出的請求可能就直接被拒絕

若是設的較大,可能就會出現大量的請求超時的狀況,由於咱們系統的處理能力是必定的。

相關文章
相關標籤/搜索