什麼是池?數據庫
漢字的基本釋義:數組
池塘;旁邊高中間窪的地方等緩存
在網絡技術範疇內,池(Pool)的概念被普遍的應用在服務器端軟件的開發上。服務器
使用池結構相比於不使用池結構的基本優點分析網絡
在銜接節點上,無池結構時須要不斷的建立和銷燬新服務對象必將給形成系統資源的巨大開銷,致使系統的性能降低,甚至系統資源耗盡併發
使用池結構能夠減小沒必要要的新服務對象的建立和銷燬,用一個容器保存着各類須要的對象。對這些對象進行復用,從而下降系統資源開銷、提升程序的響應速度、改善效率。框架
經常使用的池技術有:Socket鏈接池、JDBC鏈接池、線程池等。性能
本質上池是在資源使用時將使用率高且能夠複用的對象保存在一個相似容器的地方,對這些對象進行復用,從而下降非必須的系統資源開銷、提升程序的響應速度、改善效率。ui
線程池剖析spa
線程池的生命週期及其使用
1.建立
new ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime,
milliseconds,runnableTaskQueue, handler);
corePoolSize(線程池的基本大小)提交一個任務到線程池時,線程池會建立一個線程來執行任務,即便其餘空閒的基本線程可以執行新任務也會建立線程,等到須要執行的任務數大於線程池基本大小時就再也不建立。若是調用了線程池的prestartAllCoreThreads()方法,線程池會提早建立並啓動全部基本線程。
maximumPoolSize(線程池最大數量):線程池容許建立的最大線程數。若是隊列滿了,而且已建立的線程數小於最大線程數,則線程池會再建立新的線程執行任務。值得注意的是,若是使用了無界的任務隊列這個參數就沒什麼效果。
keepAliveTime(線程活動保持時間):線程池的工做線程空閒後,保持存活的時間。因此,若是任務不少,而且每一個任務執行的時間比較短,能夠調大時間,提升線程的利用率。
TimeUnit(線程活動保持時間的單位):可選的單位有天(DAYS)、小時(HOURS)、分鐘(MINUTES)、毫秒(MILLISECONDS)、微秒(MICROSECONDS,千分之一毫秒)和納秒(NANOSECONDS,千分之一微秒)
runnableTaskQueue(任務隊列):用於保存等待執行的任務的阻塞隊列。能夠選擇如下幾個阻塞隊列:
ArrayBlockingQueue:是一個基於數組結構的有界阻塞隊列,此隊列按FIFO(先進先出)原則對元素進行排序
LinkedBlockingQueue:一個基於鏈表結構的阻塞隊列,此隊列按FIFO排序元素,吞吐量一般要高於ArrayBlockingQueue。靜態工廠方法Executors.newFixedThreadPool()使用了這個隊列
SynchronousQueue:一個不存儲元素的阻塞隊列。每一個插入操做必須等到另外一個線程調用
移除操做,不然插入操做一直處於阻塞狀態,吞吐量一般要高於Linked-BlockingQueue,默認爲Integer.MAX_VALUE2147483647。靜態工廠方法Executors.newCachedThreadPool使用了這個隊列
PriorityBlockingQueue:一個具備優先級的無限阻塞隊列
ThreadFactory:用於設置建立線程的工廠,能夠經過線程工廠給每一個建立出來的線程設置更有意義的名字。使用開源框架guava提供的ThreadFactoryBuilder能夠快速給線程池裏的線
程設置有意義的名字,代碼以下
new ThreadFactoryBuilder().setNameFormat("XX-task-%d").build()
RejectedExecutionHandler(飽和策略):當隊列和線程池都滿了,說明線程池處於飽和狀
態,那麼必須採起一種策略處理提交的新任務。這個策略默認狀況下是AbortPolicy,表示沒法
處理新任務時拋出異常。在JDK 1.5中Java線程池框架提供瞭如下4種策略。
·AbortPolicy:直接拋出異常。
·CallerRunsPolicy:只用調用者所在線程來運行任務。
·DiscardOldestPolicy:丟棄隊列裏最近的一個任務,並執行當前任務。
·DiscardPolicy:不處理,丟棄掉。
固然,也能夠根據應用場景須要來實現RejectedExecutionHandler接口自定義策略。如記錄日誌或持久化存儲不能處理的任務
2.提交
execute()用於提交不須要返回值的任務,因此沒法判斷任務是否被線程池執行成功。
submit()提交須要返回值的任務。線程池會返回一個future類型的對象,經過這個future對象能夠判斷任務是否執行成功,而且能夠經過future的get()方法來獲取返回值,get()方法會阻塞當前線程直到任務完成,而使用get(long timeout,TimeUnit unit)方法則會阻塞當前線程一段時間後當即返回,這時候有可能任務沒有執行完。
3.關閉
shutdown將線程池的狀態設置成SHUTDOWN狀態,而後中斷全部沒有正在執行任務的線程。
shutdownNow首先將線程池的狀態設置成STOP,而後嘗試中止全部的正在執行或暫停任務的線程,並返回等待執行任務的列表。
線程池的類型
newCachedThreadPool建立一個可緩存線程池,若是線程池長度超過處理須要,可靈活回收空閒線程,若無可回收,則新建線程。隊列-SynchronizedQueue存放大小1
newFixedThreadPool定長線程池,可控制線程最大併發數,超出的線程會在隊列中等待。
隊列-LinkedBlockingQueue-無界致使maxNumPoolSize無效
newScheduledThreadPool 建立一個定長線程池,支持定時及週期性任務執行。
newSingleThreadExecutor 建立一個單線程化的線程池,它只會用惟一的工做線程來執行任務,保證全部任務按照指定順序(FIFO, LIFO, 優先級)執行。
合理使用線程池
從幾個不一樣角度來判斷和分析
任務的性質:
CPU密集型任務-應配置儘量小的線程數量,如配置N*cpu+1個線程的線程池
【獲取cpu核數:Runtime.getRuntime().availableProcessors()】
IO密集型任務-線程並非一直在執行任務,則應配置儘量多的線程
混合型任務-若是能夠拆分,將其拆分紅一個CPU密集型任務和一個IO密集型任務,只要這兩個任務執行的時間相差不是太大,那麼分解後執行的吞吐量
將高於串行執行的吞吐量。若是這兩個任務執行時間相差太大,則不必進行分解。
能夠經過Runtime.getRuntime().availableProcessors()方法得到當前設備的CPU個數
任務的優先級
可使用優先級隊列PriorityBlockingQueue來處理。它可讓優先級高的任務先執行。
執行時間不一樣
能夠交給不一樣規模的線程池來處理,或者可使用優先級隊列,讓執行時間短的任務先執行。
依賴數據庫鏈接池的任務,由於線程提交SQL後須要等待數據庫返回結果,等待的時間越
長,則CPU空閒時間就越長,那麼線程數應該設置得越大,這樣才能更好地利用CPU。線程池的監控
線程池的實現原理
當一個任務提交時(excute())
1.線程池判斷核心線程池裏的線程是否都在執行任務,若不是(少於corePoolSize)則建立一個工做線程在執行任務(須要獲取全局鎖),若是已滿,則進入下一步
2.線程池判斷工做隊列是否已滿,若是沒滿則將任務線程添加入工做隊列(BlockingQueue),不然進去下一步
3.判斷線程池裏的線程是否都處於工做狀態,不是(小於maximumPoolSize)則建立新線程來完成任務(須要獲取全局鎖),不然交給飽和策略[RejectExcutionHandle.rejectedExcution()]來處理這個任務
這些步驟是爲了不使用全局鎖[多是一個嚴重的可伸縮瓶頸]
工做線程:線程池建立線程時,會將線程封裝成工做線程worker,worker在執行任務完成以後會循環從阻塞隊列裏獲取任務來執行。