合理設置工做線程數

時間 2019-11-17

標籤合理設置線程简体版

原文原文鏈接

最大工做線程數，後端服務通常也有個配置，工做線程池的線程數量，這個線程數的配置不一樣的業務架構師有不一樣的經驗值，有些業務設置爲CPU核數的2倍，有些業務設置爲CPU核數的8倍，有些業務設置爲CPU核數的32倍。html

一個典型的工做線程的處理過程，從開始處理start到結束處理end，該任務的處理共有7個步驟：數據庫

分析整個處理的時間軸，會發現：排序

線程進行本地業務邏輯計算時須要佔用CPU

訪問cache、service、DB過程當中線程處於一個等待結果的狀態，不須要佔用CPU

經過量化分析，例如打日誌進行統計，能夠統計出整個Worker線程執行過程當中這兩部分時間的比例，例如：

獲得的結果是，這個線程計算和等待的時間是1：1，即有50%的時間在計算（佔用CPU），50%的時間在等待（不佔用CPU）：

結論：

N核服務器，經過執行業務的單線程分析出本地計算時間爲x，等待時間爲y，則工做線程數（線程池線程數）設置爲 N*(x+y)/x，能讓CPU的利用率最大化。

經驗：

通常來講，非CPU密集型的業務（加解密、壓縮解壓縮、搜索排序等業務是CPU密集型的業務），瓶頸都在後端數據庫訪問或者RPC調用，本地CPU計算的時間不多，因此設置幾十或者幾百個工做線程是可以提高吞吐量的。

6、總結

線程數不是越多越好
sleep()不佔用CPU
單核設置多線程不但能使得代碼清晰，還能提升吞吐量
站點和服務最經常使用的線程模型是「IO線程與工做現場經過任務隊列解耦」，此時設置多工做線程能夠提高吞吐量
N核服務器，經過日誌分析出任務執行過程當中，本地計算時間爲x，等待時間爲y，則工做線程數（線程池線程數）設置爲 N*(x+y)/x，能讓CPU的利用率最大化