深刻理解Java線程池：ThreadPoolExecutor

時間 2019-11-19

標籤深刻理解 java 線程 threadpoolexecutor 欄目 Java 简体版

原文原文鏈接

線程池介紹

在web開發中，服務器須要接受並處理請求，因此會爲一個請求來分配一個線程來進行處理。若是每次請求都新建立一個線程的話實現起來很是簡便，可是存在一個問題：java

若是併發的請求數量很是多，但每一個線程執行的時間很短，這樣就會頻繁的建立和銷燬線程，如此一來會大大下降系統的效率。可能出現服務器在爲每一個請求建立新線程和銷燬線程上花費的時間和消耗的系統資源要比處理實際的用戶請求的時間和資源更多。web

那麼有沒有一種辦法使執行完一個任務，並不被銷燬，而是能夠繼續執行其餘的任務呢？安全

這就是線程池的目的了。線程池爲線程生命週期的開銷和資源不足問題提供瞭解決方案。經過對多個任務重用線程，線程建立的開銷被分攤到了多個任務上。服務器

何時使用線程池？多線程

單個任務處理時間比較短
須要處理的任務數量很大

使用線程池的好處併發

引用自 http://ifeve.com/java-threadpool/ 的說明：框架

下降資源消耗。經過重複利用已建立的線程下降線程建立和銷燬形成的消耗。
提升響應速度。當任務到達時，任務能夠不須要的等到線程建立就能當即執行。
提升線程的可管理性。線程是稀缺資源，若是無限制的建立，不只會消耗系統資源，還會下降系統的穩定性，使用線程池能夠進行統一的分配，調優和監控。

Java中的線程池是用ThreadPoolExecutor類來實現的. 本文就結合JDK 1.8對該類的源碼來分析一下這個類內部對於線程的建立, 管理以及後臺任務的調度等方面的執行原理。異步

先看一下線程池的類圖：ide

Executor框架接口

Executor框架是一個根據一組執行策略調用，調度，執行和控制的異步任務的框架，目的是提供一種將」任務提交」與」任務如何運行」分離開來的機制。oop

J.U.C中有三個Executor接口：

Executor：一個運行新任務的簡單接口；
ExecutorService：擴展了Executor接口。添加了一些用來管理執行器生命週期和任務生命週期的方法；
ScheduledExecutorService：擴展了ExecutorService。支持Future和按期執行任務。

Executor接口

public interface Executor {
    void execute(Runnable command);
}

Executor接口只有一個execute方法，用來替代一般建立或啓動線程的方法。例如，使用Thread來建立並啓動線程的代碼以下：

Thread t = new Thread();
t.start();

使用Executor來啓動線程執行任務的代碼以下：

Thread t = new Thread();
executor.execute(t);

對於不一樣的Executor實現，execute()方法多是建立一個新線程並當即啓動，也有多是使用已有的工做線程來運行傳入的任務，也多是根據設置線程池的容量或者阻塞隊列的容量來決定是否要將傳入的線程放入阻塞隊列中或者拒絕接收傳入的線程。

ExecutorService接口

ExecutorService接口繼承自Executor接口，提供了管理終止的方法，以及可爲跟蹤一個或多個異步任務執行情況而生成 Future 的方法。增長了shutDown()，shutDownNow()，invokeAll()，invokeAny()和submit()等方法。若是須要支持即時關閉，也就是shutDownNow()方法，則任務須要正確處理中斷。

ScheduledExecutorService接口

ScheduledExecutorService擴展ExecutorService接口並增長了schedule方法。調用schedule方法能夠在指定的延時後執行一個Runnable或者Callable任務。ScheduledExecutorService接口還定義了按照指定時間間隔按期執行任務的scheduleAtFixedRate()方法和scheduleWithFixedDelay()方法。

ThreadPoolExecutor分析

ThreadPoolExecutor繼承自AbstractExecutorService，也是實現了ExecutorService接口。

幾個重要的字段

private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static final int COUNT_BITS = Integer.SIZE - 3;
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;
// runState is stored in the high-order bits
private static final int RUNNING    = -1 << COUNT_BITS;
private static final int SHUTDOWN   =  0 << COUNT_BITS;
private static final int STOP       =  1 << COUNT_BITS;
private static final int TIDYING    =  2 << COUNT_BITS;
private static final int TERMINATED =  3 << COUNT_BITS;

ctl是對線程池的運行狀態和線程池中有效線程的數量進行控制的一個字段，它包含兩部分的信息: 線程池的運行狀態 (runState) 和線程池內有效線程的數量 (workerCount)，這裏能夠看到，使用了Integer類型來保存，高3位保存runState，低29位保存workerCount。COUNT_BITS 就是29，CAPACITY就是1左移29位減1（29個1），這個常量表示workerCount的上限值，大約是5億。

下面再介紹下線程池的運行狀態. 線程池一共有五種狀態, 分別是:

RUNNING ：能接受新提交的任務，而且也能處理阻塞隊列中的任務；
SHUTDOWN：關閉狀態，再也不接受新提交的任務，但卻能夠繼續處理阻塞隊列中已保存的任務。在線程池處於 RUNNING 狀態時，調用 shutdown()方法會使線程池進入到該狀態。（finalize() 方法在執行過程當中也會調用shutdown()方法進入該狀態）；
STOP：不能接受新任務，也不處理隊列中的任務，會中斷正在處理任務的線程。在線程池處於 RUNNING 或 SHUTDOWN 狀態時，調用 shutdownNow() 方法會使線程池進入到該狀態；
TIDYING：若是全部的任務都已終止了，workerCount (有效線程數) 爲0，線程池進入該狀態後會調用 terminated() 方法進入TERMINATED 狀態。
TERMINATED：在terminated() 方法執行完後進入該狀態，默認terminated()方法中什麼也沒有作。
進入TERMINATED的條件以下：
- 線程池不是RUNNING狀態；
- 線程池狀態不是TIDYING狀態或TERMINATED狀態；
- 若是線程池狀態是SHUTDOWN而且workerQueue爲空；
- workerCount爲0；
- 設置TIDYING狀態成功。

下圖爲線程池的狀態轉換過程：

ctl相關方法

這裏還有幾個對ctl進行計算的方法：

private static int runStateOf(int c)     { return c & ~CAPACITY; }
private static int workerCountOf(int c)  { return c & CAPACITY; }
private static int ctlOf(int rs, int wc) { return rs | wc; }

runStateOf：獲取運行狀態；
workerCountOf：獲取活動線程數；
ctlOf：獲取運行狀態和活動線程數的值。

ThreadPoolExecutor構造方法

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler) {
    if (corePoolSize < 0 ||
        maximumPoolSize <= 0 ||
        maximumPoolSize < corePoolSize ||
        keepAliveTime < 0)
        throw new IllegalArgumentException();
    if (workQueue == null || threadFactory == null || handler == null)
        throw new NullPointerException();
    this.corePoolSize = corePoolSize;
    this.maximumPoolSize = maximumPoolSize;
    this.workQueue = workQueue;
    this.keepAliveTime = unit.toNanos(keepAliveTime);
    this.threadFactory = threadFactory;
    this.handler = handler;
}

構造方法中的字段含義以下：

corePoolSize：核心線程數量，當有新任務在execute()方法提交時，會執行如下判斷：
1. 若是運行的線程少於 corePoolSize，則建立新線程來處理任務，即便線程池中的其餘線程是空閒的；
2. 若是線程池中的線程數量大於等於 corePoolSize 且小於 maximumPoolSize，則只有當workQueue滿時才建立新的線程去處理任務；
3. 若是設置的corePoolSize 和 maximumPoolSize相同，則建立的線程池的大小是固定的，這時若是有新任務提交，若workQueue未滿，則將請求放入workQueue中，等待有空閒的線程去從workQueue中取任務並處理；
4. 若是運行的線程數量大於等於maximumPoolSize，這時若是workQueue已經滿了，則經過handler所指定的策略來處理任務；
因此，任務提交時，判斷的順序爲 corePoolSize –> workQueue –> maximumPoolSize。
maximumPoolSize：最大線程數量；
workQueue：等待隊列，當任務提交時，若是線程池中的線程數量大於等於corePoolSize的時候，把該任務封裝成一個Worker對象放入等待隊列；
workQueue：保存等待執行的任務的阻塞隊列，當提交一個新的任務到線程池之後, 線程池會根據當前線程池中正在運行着的線程的數量來決定對該任務的處理方式，主要有如下幾種處理方式:
1. 直接切換：這種方式經常使用的隊列是SynchronousQueue，但如今尚未研究過該隊列，這裏暫時還無法介紹；
2. 使用無界隊列：通常使用基於鏈表的阻塞隊列LinkedBlockingQueue。若是使用這種方式，那麼線程池中可以建立的最大線程數就是corePoolSize，而maximumPoolSize就不會起做用了（後面也會說到）。當線程池中全部的核心線程都是RUNNING狀態時，這時一個新的任務提交就會放入等待隊列中。
3. 使用有界隊列：通常使用ArrayBlockingQueue。使用該方式能夠將線程池的最大線程數量限制爲maximumPoolSize，這樣可以下降資源的消耗，但同時這種方式也使得線程池對線程的調度變得更困難，由於線程池和隊列的容量都是有限的值，因此要想使線程池處理任務的吞吐率達到一個相對合理的範圍，又想使線程調度相對簡單，而且還要儘量的下降線程池對資源的消耗，就須要合理的設置這兩個數量。
  - 若是要想下降系統資源的消耗（包括CPU的使用率，操做系統資源的消耗，上下文環境切換的開銷等）, 能夠設置較大的隊列容量和較小的線程池容量, 但這樣也會下降線程處理任務的吞吐量。
  - 若是提交的任務常常發生阻塞，那麼能夠考慮經過調用 setMaximumPoolSize() 方法來從新設定線程池的容量。
  - 若是隊列的容量設置的較小，一般須要將線程池的容量設置大一點，這樣CPU的使用率會相對的高一些。但若是線程池的容量設置的過大，則在提交的任務數量太多的狀況下，併發量會增長，那麼線程之間的調度就是一個要考慮的問題，由於這樣反而有可能下降處理任務的吞吐量。
keepAliveTime：線程池維護線程所容許的空閒時間。當線程池中的線程數量大於corePoolSize的時候，若是這時沒有新的任務提交，核心線程外的線程不會當即銷燬，而是會等待，直到等待的時間超過了keepAliveTime；
threadFactory：它是ThreadFactory類型的變量，用來建立新線程。默認使用Executors.defaultThreadFactory() 來建立線程。使用默認的ThreadFactory來建立線程時，會使新建立的線程具備相同的NORM_PRIORITY優先級而且是非守護線程，同時也設置了線程的名稱。
handler：它是RejectedExecutionHandler類型的變量，表示線程池的飽和策略。若是阻塞隊列滿了而且沒有空閒的線程，這時若是繼續提交任務，就須要採起一種策略處理該任務。線程池提供了4種策略：
1. AbortPolicy：直接拋出異常，這是默認策略；
2. CallerRunsPolicy：用調用者所在的線程來執行任務；
3. DiscardOldestPolicy：丟棄阻塞隊列中靠最前的任務，並執行當前任務；
4. DiscardPolicy：直接丟棄任務；

execute方法

execute()方法用來提交任務，代碼以下：

public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException();
    /*
     * clt記錄着runState和workerCount
     */
    int c = ctl.get();
    /*
     * workerCountOf方法取出低29位的值，表示當前活動的線程數；
     * 若是當前活動線程數小於corePoolSize，則新建一個線程放入線程池中；
     * 並把任務添加到該線程中。
     */
    if (workerCountOf(c) < corePoolSize) {
        /*
         * addWorker中的第二個參數表示限制添加線程的數量是根據corePoolSize來判斷仍是maximumPoolSize來判斷；
         * 若是爲true，根據corePoolSize來判斷；
         * 若是爲false，則根據maximumPoolSize來判斷
         */
        if (addWorker(command, true))
            return;
        /*
         * 若是添加失敗，則從新獲取ctl值
         */
        c = ctl.get();
    }
    /*
     * 若是當前線程池是運行狀態而且任務添加到隊列成功
     */
    if (isRunning(c) && workQueue.offer(command)) {
        // 從新獲取ctl值
        int recheck = ctl.get();
        // 再次判斷線程池的運行狀態，若是不是運行狀態，因爲以前已經把command添加到workQueue中了，
        // 這時須要移除該command
        // 執行事後經過handler使用拒絕策略對該任務進行處理，整個方法返回
        if (! isRunning(recheck) && remove(command))
            reject(command);
        /*
         * 獲取線程池中的有效線程數，若是數量是0，則執行addWorker方法
         * 這裏傳入的參數表示：
         * 1. 第一個參數爲null，表示在線程池中建立一個線程，但不去啓動；
         * 2. 第二個參數爲false，將線程池的有限線程數量的上限設置爲maximumPoolSize，添加線程時根據maximumPoolSize來判斷；
         * 若是判斷workerCount大於0，則直接返回，在workQueue中新增的command會在未來的某個時刻被執行。
         */
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    /*
     * 若是執行到這裏，有兩種狀況：
     * 1. 線程池已經不是RUNNING狀態；
     * 2. 線程池是RUNNING狀態，但workerCount >= corePoolSize而且workQueue已滿。
     * 這時，再次調用addWorker方法，但第二個參數傳入爲false，將線程池的有限線程數量的上限設置爲maximumPoolSize；
     * 若是失敗則拒絕該任務
     */
    else if (!addWorker(command, false))
        reject(command);
}

簡單來講，在執行execute()方法時若是狀態一直是RUNNING時，的執行過程以下：

若是workerCount < corePoolSize，則建立並啓動一個線程來執行新提交的任務；
若是workerCount >= corePoolSize，且線程池內的阻塞隊列未滿，則將任務添加到該阻塞隊列中；
若是workerCount >= corePoolSize && workerCount < maximumPoolSize，且線程池內的阻塞隊列已滿，則建立並啓動一個線程來執行新提交的任務；
若是workerCount >= maximumPoolSize，而且線程池內的阻塞隊列已滿, 則根據拒絕策略來處理該任務, 默認的處理方式是直接拋異常。

這裏要注意一下addWorker(null, false);，也就是建立一個線程，但並無傳入任務，由於任務已經被添加到workQueue中了，因此worker在執行的時候，會直接從workQueue中獲取任務。因此，在workerCountOf(recheck) == 0時執行addWorker(null, false);也是爲了保證線程池在RUNNING狀態下必需要有一個線程來執行任務。

execute方法執行流程以下：

addWorker方法

addWorker方法的主要工做是在線程池中建立一個新的線程並執行，firstTask參數用於指定新增的線程執行的第一個任務，core參數爲true表示在新增線程時會判斷當前活動線程數是否少於corePoolSize，false表示新增線程前須要判斷當前活動線程數是否少於maximumPoolSize，代碼以下：

private boolean addWorker(Runnable firstTask, boolean core) {
    retry:
    for (;;) {
        int c = ctl.get();
        // 獲取運行狀態
        int rs = runStateOf(c);
        
        /*
         * 這個if判斷
         * 若是rs >= SHUTDOWN，則表示此時再也不接收新任務；
         * 接着判斷如下3個條件，只要有1個不知足，則返回false：
         * 1. rs == SHUTDOWN，這時表示關閉狀態，再也不接受新提交的任務，但卻能夠繼續處理阻塞隊列中已保存的任務
         * 2. firsTask爲空
         * 3. 阻塞隊列不爲空
         * 
         * 首先考慮rs == SHUTDOWN的狀況
         * 這種狀況下不會接受新提交的任務，因此在firstTask不爲空的時候會返回false；
         * 而後，若是firstTask爲空，而且workQueue也爲空，則返回false，
         * 由於隊列中已經沒有任務了，不須要再添加線程了
         */
        // Check if queue empty only if necessary.
        if (rs >= SHUTDOWN &&
            ! (rs == SHUTDOWN &&
               firstTask == null &&
               ! workQueue.isEmpty()))
            return false;
        for (;;) {
            // 獲取線程數
            int wc = workerCountOf(c);
            // 若是wc超過CAPACITY，也就是ctl的低29位的最大值（二進制是29個1），返回false；
            // 這裏的core是addWorker方法的第二個參數，若是爲true表示根據corePoolSize來比較，
            // 若是爲false則根據maximumPoolSize來比較。
            // 
            if (wc >= CAPACITY ||
                wc >= (core ? corePoolSize : maximumPoolSize))
                return false;
            // 嘗試增長workerCount，若是成功，則跳出第一個for循環
            if (compareAndIncrementWorkerCount(c))
                break retry;
            // 若是增長workerCount失敗，則從新獲取ctl的值
            c = ctl.get();  // Re-read ctl
            // 若是當前的運行狀態不等於rs，說明狀態已被改變，返回第一個for循環繼續執行
            if (runStateOf(c) != rs)
                continue retry;
            // else CAS failed due to workerCount change; retry inner loop
        }
    }
    boolean workerStarted = false;
    boolean workerAdded = false;
    Worker w = null;
    try {
        // 根據firstTask來建立Worker對象
        w = new Worker(firstTask);
        // 每個Worker對象都會建立一個線程
        final Thread t = w.thread;
        if (t != null) {
            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                // Recheck while holding lock.
                // Back out on ThreadFactory failure or if
                // shut down before lock acquired.
                int rs = runStateOf(ctl.get());
                // rs < SHUTDOWN表示是RUNNING狀態；
                // 若是rs是RUNNING狀態或者rs是SHUTDOWN狀態而且firstTask爲null，向線程池中添加線程。
                // 由於在SHUTDOWN時不會在添加新的任務，但仍是會執行workQueue中的任務
                if (rs < SHUTDOWN ||
                    (rs == SHUTDOWN && firstTask == null)) {
                    if (t.isAlive()) // precheck that t is startable
                        throw new IllegalThreadStateException();
                    // workers是一個HashSet
                    workers.add(w);
                    int s = workers.size();
                    // largestPoolSize記錄着線程池中出現過的最大線程數量
                    if (s > largestPoolSize)
                        largestPoolSize = s;
                    workerAdded = true;
                }
            } finally {
                mainLock.unlock();
            }
            if (workerAdded) {
                // 啓動線程
                t.start();
                workerStarted = true;
            }
        }
    } finally {
        if (! workerStarted)
            addWorkerFailed(w);
    }
    return workerStarted;
}

注意一下這裏的t.start()這個語句，啓動時會調用Worker類中的run方法，Worker自己實現了Runnable接口，因此一個Worker類型的對象也是一個線程。

Worker類

線程池中的每個線程被封裝成一個Worker對象，ThreadPool維護的其實就是一組Worker對象，看一下Worker的定義：

private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable
{
    /**
     * This class will never be serialized, but we provide a
     * serialVersionUID to suppress a javac warning.
     */
    private static final long serialVersionUID = 6138294804551838833L;
    /** Thread this worker is running in.  Null if factory fails. */
    final Thread thread;
    /** Initial task to run.  Possibly null. */
    Runnable firstTask;
    /** Per-thread task counter */
    volatile long completedTasks;
    /**
     * Creates with given first task and thread from ThreadFactory.
     * @param firstTask the first task (null if none)
     */
    Worker(Runnable firstTask) {
        setState(-1); // inhibit interrupts until runWorker
        this.firstTask = firstTask;
        this.thread = getThreadFactory().newThread(this);
    }
    /** Delegates main run loop to outer runWorker  */
    public void run() {
        runWorker(this);
    }
    // Lock methods
    //
    // The value 0 represents the unlocked state.
    // The value 1 represents the locked state.
    protected boolean isHeldExclusively() {
        return getState() != 0;
    }
    protected boolean tryAcquire(int unused) {
        if (compareAndSetState(0, 1)) {
            setExclusiveOwnerThread(Thread.currentThread());
            return true;
        }
        return false;
    }
    protected boolean tryRelease(int unused) {
        setExclusiveOwnerThread(null);
        setState(0);
        return true;
    }
    public void lock()        { acquire(1); }
    public boolean tryLock()  { return tryAcquire(1); }
    public void unlock()      { release(1); }
    public boolean isLocked() { return isHeldExclusively(); }
    void interruptIfStarted() {
        Thread t;
        if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
            try {
                t.interrupt();
            } catch (SecurityException ignore) {
            }
        }
    }
}

Worker類繼承了AQS，並實現了Runnable接口，注意其中的firstTask和thread屬性：firstTask用它來保存傳入的任務；thread是在調用構造方法時經過ThreadFactory來建立的線程，是用來處理任務的線程。

在調用構造方法時，須要把任務傳入，這裏經過getThreadFactory().newThread(this);來新建一個線程，newThread方法傳入的參數是this，由於Worker自己繼承了Runnable接口，也就是一個線程，因此一個Worker對象在啓動的時候會調用Worker類中的run方法。

Worker繼承了AQS，使用AQS來實現獨佔鎖的功能。爲何不使用ReentrantLock來實現呢？能夠看到tryAcquire方法，它是不容許重入的，而ReentrantLock是容許重入的：

lock方法一旦獲取了獨佔鎖，表示當前線程正在執行任務中；
若是正在執行任務，則不該該中斷線程；
若是該線程如今不是獨佔鎖的狀態，也就是空閒的狀態，說明它沒有在處理任務，這時能夠對該線程進行中斷；
線程池在執行shutdown方法或tryTerminate方法時會調用interruptIdleWorkers方法來中斷空閒的線程，interruptIdleWorkers方法會使用tryLock方法來判斷線程池中的線程是不是空閒狀態；
之因此設置爲不可重入，是由於咱們不但願任務在調用像setCorePoolSize這樣的線程池控制方法時從新獲取鎖。若是使用ReentrantLock，它是可重入的，這樣若是在任務中調用瞭如setCorePoolSize這類線程池控制的方法，會中斷正在運行的線程。

因此，Worker繼承自AQS，用於判斷線程是否空閒以及是否能夠被中斷。

此外，在構造方法中執行了setState(-1);，把state變量設置爲-1，爲何這麼作呢？是由於AQS中默認的state是0，若是剛建立了一個Worker對象，尚未執行任務時，這時就不該該被中斷，看一下tryAquire方法：

protected boolean tryAcquire(int unused) {
    if (compareAndSetState(0, 1)) {
        setExclusiveOwnerThread(Thread.currentThread());
        return true;
    }
    return false;
}

tryAcquire方法是根據state是不是0來判斷的，因此，setState(-1);將state設置爲-1是爲了禁止在執行任務前對線程進行中斷。

正由於如此，在runWorker方法中會先調用Worker對象的unlock方法將state設置爲0.

runWorker方法

在Worker類中的run方法調用了runWorker方法來執行任務，runWorker方法的代碼以下：

final void runWorker(Worker w) {
    Thread wt = Thread.currentThread();
    // 獲取第一個任務
    Runnable task = w.firstTask;
    w.firstTask = null;
    // 容許中斷
    w.unlock(); // allow interrupts
    // 是否由於異常退出循環
    boolean completedAbruptly = true;
    try {
        // 若是task爲空，則經過getTask來獲取任務
        while (task != null || (task = getTask()) != null) {
            w.lock();
            // If pool is stopping, ensure thread is interrupted;
            // if not, ensure thread is not interrupted.  This
            // requires a recheck in second case to deal with
            // shutdownNow race while clearing interrupt
            if ((runStateAtLeast(ctl.get(), STOP) ||
                 (Thread.interrupted() &&
                  runStateAtLeast(ctl.get(), STOP))) &&
                !wt.isInterrupted())
                wt.interrupt();
            try {
                beforeExecute(wt, task);
                Throwable thrown = null;
                try {
                    task.run();
                } catch (RuntimeException x) {
                    thrown = x; throw x;
                } catch (Error x) {
                    thrown = x; throw x;
                } catch (Throwable x) {
                    thrown = x; throw new Error(x);
                } finally {
                    afterExecute(task, thrown);
                }
            } finally {
                task = null;
                w.completedTasks++;
                w.unlock();
            }
        }
        completedAbruptly = false;
    } finally {
        processWorkerExit(w, completedAbruptly);
    }
}

這裏說明一下第一個if判斷，目的是：

若是線程池正在中止，那麼要保證當前線程是中斷狀態；
若是不是的話，則要保證當前線程不是中斷狀態；

這裏要考慮在執行該if語句期間可能也執行了shutdownNow方法，shutdownNow方法會把狀態設置爲STOP，回顧一下STOP狀態：

不能接受新任務，也不處理隊列中的任務，會中斷正在處理任務的線程。在線程池處於 RUNNING 或 SHUTDOWN 狀態時，調用 shutdownNow() 方法會使線程池進入到該狀態。

STOP狀態要中斷線程池中的全部線程，而這裏使用Thread.interrupted()來判斷是否中斷是爲了確保在RUNNING或者SHUTDOWN狀態時線程是非中斷狀態的，由於Thread.interrupted()方法會復位中斷的狀態。

總結一下runWorker方法的執行過程：

while循環不斷地經過getTask()方法獲取任務；
getTask()方法從阻塞隊列中取任務；
若是線程池正在中止，那麼要保證當前線程是中斷狀態，不然要保證當前線程不是中斷狀態；
調用task.run()執行任務；
若是task爲null則跳出循環，執行processWorkerExit()方法；
runWorker方法執行完畢，也表明着Worker中的run方法執行完畢，銷燬線程。

這裏的beforeExecute方法和afterExecute方法在ThreadPoolExecutor類中是空的，留給子類來實現。

completedAbruptly變量來表示在執行任務過程當中是否出現了異常，在processWorkerExit方法中會對該變量的值進行判斷。

getTask方法

getTask方法用來從阻塞隊列中取任務，代碼以下：

private Runnable getTask() {
    // timeOut變量的值表示上次從阻塞隊列中取任務時是否超時
    boolean timedOut = false; // Did the last poll() time out?
    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);
        // Check if queue empty only if necessary.
        /*
         * 若是線程池狀態rs >= SHUTDOWN，也就是非RUNNING狀態，再進行如下判斷：
         * 1. rs >= STOP，線程池是否正在stop；
         * 2. 阻塞隊列是否爲空。
         * 若是以上條件知足，則將workerCount減1並返回null。
         * 由於若是當前線程池狀態的值是SHUTDOWN或以上時，不容許再向阻塞隊列中添加任務。
         */
        if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
            decrementWorkerCount();
            return null;
        }
        int wc = workerCountOf(c);
        // Are workers subject to culling?
        // timed變量用於判斷是否須要進行超時控制。
        // allowCoreThreadTimeOut默認是false，也就是核心線程不容許進行超時；
        // wc > corePoolSize，表示當前線程池中的線程數量大於核心線程數量；
        // 對於超過核心線程數量的這些線程，須要進行超時控制
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
        
        /*
         * wc > maximumPoolSize的狀況是由於可能在此方法執行階段同時執行了setMaximumPoolSize方法；
         * timed && timedOut 若是爲true，表示當前操做須要進行超時控制，而且上次從阻塞隊列中獲取任務發生了超時
         * 接下來判斷，若是有效線程數量大於1，或者阻塞隊列是空的，那麼嘗試將workerCount減1；
         * 若是減1失敗，則返回重試。
         * 若是wc == 1時，也就說明當前線程是線程池中惟一的一個線程了。
         */
        if ((wc > maximumPoolSize || (timed && timedOut))
            && (wc > 1 || workQueue.isEmpty())) {
            if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }
        try {
            /*
             * 根據timed來判斷，若是爲true，則經過阻塞隊列的poll方法進行超時控制，若是在keepAliveTime時間內沒有獲取到任務，則返回null；
             * 不然經過take方法，若是這時隊列爲空，則take方法會阻塞直到隊列不爲空。
             * 
             */
            Runnable r = timed ?
                workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                workQueue.take();
            if (r != null)
                return r;
            // 若是 r == null，說明已經超時，timedOut設置爲true
            timedOut = true;
        } catch (InterruptedException retry) {
            // 若是獲取任務時當前線程發生了中斷，則設置timedOut爲false並返回循環重試
            timedOut = false;
        }
    }
}

這裏重要的地方是第二個if判斷，目的是控制線程池的有效線程數量。由上文中的分析能夠知道，在執行execute方法時，若是當前線程池的線程數量超過了corePoolSize且小於maximumPoolSize，而且workQueue已滿時，則能夠增長工做線程，但這時若是超時沒有獲取到任務，也就是timedOut爲true的狀況，說明workQueue已經爲空了，也就說明了當前線程池中不須要那麼多線程來執行任務了，能夠把多於corePoolSize數量的線程銷燬掉，保持線程數量在corePoolSize便可。

何時會銷燬？固然是runWorker方法執行完以後，也就是Worker中的run方法執行完，由JVM自動回收。

getTask方法返回null時，在runWorker方法中會跳出while循環，而後會執行processWorkerExit方法。

processWorkerExit方法

private void processWorkerExit(Worker w, boolean completedAbruptly) {
    // 若是completedAbruptly值爲true，則說明線程執行時出現了異常，須要將workerCount減1；
    // 若是線程執行時沒有出現異常，說明在getTask()方法中已經已經對workerCount進行了減1操做，這裏就沒必要再減了。  
    if (completedAbruptly) // If abrupt, then workerCount wasn't adjusted
        decrementWorkerCount();
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        //統計完成的任務數
        completedTaskCount += w.completedTasks;
        // 從workers中移除，也就表示着從線程池中移除了一個工做線程
        workers.remove(w);
    } finally {
        mainLock.unlock();
    }
    // 根據線程池狀態進行判斷是否結束線程池
    tryTerminate();
    int c = ctl.get();
    /*
     * 當線程池是RUNNING或SHUTDOWN狀態時，若是worker是異常結束，那麼會直接addWorker；
     * 若是allowCoreThreadTimeOut=true，而且等待隊列有任務，至少保留一個worker；
     * 若是allowCoreThreadTimeOut=false，workerCount很多於corePoolSize。
     */
    if (runStateLessThan(c, STOP)) {
        if (!completedAbruptly) {
            int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
            if (min == 0 && ! workQueue.isEmpty())
                min = 1;
            if (workerCountOf(c) >= min)
                return; // replacement not needed
        }
        addWorker(null, false);
    }
}

至此，processWorkerExit執行完以後，工做線程被銷燬，以上就是整個工做線程的生命週期，從execute方法開始，Worker使用ThreadFactory建立新的工做線程，runWorker經過getTask獲取任務，而後執行任務，若是getTask返回null，進入processWorkerExit方法，整個線程結束，如圖所示：

tryTerminate方法

tryTerminate方法根據線程池狀態進行判斷是否結束線程池，代碼以下：

final void tryTerminate() {
    for (;;) {
        int c = ctl.get();
        /*
         * 當前線程池的狀態爲如下幾種狀況時，直接返回：
         * 1. RUNNING，由於還在運行中，不能中止；
         * 2. TIDYING或TERMINATED，由於線程池中已經沒有正在運行的線程了；
         * 3. SHUTDOWN而且等待隊列非空，這時要執行完workQueue中的task；
         */
        if (isRunning(c) ||
            runStateAtLeast(c, TIDYING) ||
            (runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty()))
            return;
        // 若是線程數量不爲0，則中斷一個空閒的工做線程，並返回
        if (workerCountOf(c) != 0) { // Eligible to terminate
            interruptIdleWorkers(ONLY_ONE);
            return;
        }
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            // 這裏嘗試設置狀態爲TIDYING，若是設置成功，則調用terminated方法
            if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
                try {
                    // terminated方法默認什麼都不作，留給子類實現
                    terminated();
                } finally {
                    // 設置狀態爲TERMINATED
                    ctl.set(ctlOf(TERMINATED, 0));
                    termination.signalAll();
                }
                return;
            }
        } finally {
            mainLock.unlock();
        }
        // else retry on failed CAS
    }
}

interruptIdleWorkers(ONLY_ONE);的做用是由於在getTask方法中執行workQueue.take()時，若是不執行中斷會一直阻塞。在下面介紹的shutdown方法中，會中斷全部空閒的工做線程，若是在執行shutdown時工做線程沒有空閒，而後又去調用了getTask方法，這時若是workQueue中沒有任務了，調用workQueue.take()時就會一直阻塞。因此每次在工做線程結束時調用tryTerminate方法來嘗試中斷一個空閒工做線程，避免在隊列爲空時取任務一直阻塞的狀況。

shutdown方法

shutdown方法要將線程池切換到SHUTDOWN狀態，並調用interruptIdleWorkers方法請求中斷全部空閒的worker，最後調用tryTerminate嘗試結束線程池。

public void shutdown() {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        // 安全策略判斷
        checkShutdownAccess();
        // 切換狀態爲SHUTDOWN
        advanceRunState(SHUTDOWN);
        // 中斷空閒線程
        interruptIdleWorkers();
        onShutdown(); // hook for ScheduledThreadPoolExecutor
    } finally {
        mainLock.unlock();
    }
    // 嘗試結束線程池
    tryTerminate();
}

這裏思考一個問題：在runWorker方法中，執行任務時對Worker對象w進行了lock操做，爲何要在執行任務的時候對每一個工做線程都加鎖呢？

下面仔細分析一下：

在getTask方法中，若是這時線程池的狀態是SHUTDOWN而且workQueue爲空，那麼就應該返回null來結束這個工做線程，而使線程池進入SHUTDOWN狀態須要調用shutdown方法；
shutdown方法會調用interruptIdleWorkers來中斷空閒的線程，interruptIdleWorkers持有mainLock，會遍歷workers來逐個判斷工做線程是否空閒。但getTask方法中沒有mainLock；
在getTask中，若是判斷當前線程池狀態是RUNNING，而且阻塞隊列爲空，那麼會調用workQueue.take()進行阻塞；
若是在判斷當前線程池狀態是RUNNING後，這時調用了shutdown方法把狀態改成了SHUTDOWN，這時若是不進行中斷，那麼當前的工做線程在調用了workQueue.take()後會一直阻塞而不會被銷燬，由於在SHUTDOWN狀態下不容許再有新的任務添加到workQueue中，這樣一來線程池永遠都關閉不了了；
由上可知，shutdown方法與getTask方法（從隊列中獲取任務時）存在競態條件；
解決這一問題就須要用到線程的中斷，也就是爲何要用interruptIdleWorkers方法。在調用workQueue.take()時，若是發現當前線程在執行以前或者執行期間是中斷狀態，則會拋出InterruptedException，解除阻塞的狀態；
可是要中斷工做線程，還要判斷工做線程是不是空閒的，若是工做線程正在處理任務，就不該該發生中斷；
因此Worker繼承自AQS，在工做線程處理任務時會進行lock，interruptIdleWorkers在進行中斷時會使用tryLock來判斷該工做線程是否正在處理任務，若是tryLock返回true，說明該工做線程當前未執行任務，這時才能夠被中斷。

下面就來分析一下interruptIdleWorkers方法。

interruptIdleWorkers方法

private void interruptIdleWorkers() {
    interruptIdleWorkers(false);
}
private void interruptIdleWorkers(boolean onlyOne) {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        for (Worker w : workers) {
            Thread t = w.thread;
            if (!t.isInterrupted() && w.tryLock()) {
                try {
                    t.interrupt();
                } catch (SecurityException ignore) {
                } finally {
                    w.unlock();
                }
            }
            if (onlyOne)
                break;
        }
    } finally {
        mainLock.unlock();
    }
}

interruptIdleWorkers遍歷workers中全部的工做線程，若線程沒有被中斷tryLock成功，就中斷該線程。

爲何須要持有mainLock？由於workers是HashSet類型的，不能保證線程安全。

shutdownNow方法

public List<Runnable> shutdownNow() {
    List<Runnable> tasks;
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        checkShutdownAccess();
        advanceRunState(STOP);
        // 中斷全部工做線程，不管是否空閒
        interruptWorkers();
        // 取出隊列中沒有被執行的任務
        tasks = drainQueue();
    } finally {
        mainLock.unlock();
    }
    tryTerminate();
    return tasks;
}

shutdownNow方法與shutdown方法相似，不一樣的地方在於：

設置狀態爲STOP；
中斷全部工做線程，不管是不是空閒的；
取出阻塞隊列中沒有被執行的任務並返回。

shutdownNow方法執行完以後調用tryTerminate方法，該方法在上文已經分析過了，目的就是使線程池的狀態設置爲TERMINATED。

線程池的監控

經過線程池提供的參數進行監控。線程池裏有一些屬性在監控線程池的時候可使用

getTaskCount：線程池已經執行的和未執行的任務總數；
getCompletedTaskCount：線程池已完成的任務數量，該值小於等於taskCount；
getLargestPoolSize：線程池曾經建立過的最大線程數量。經過這個數據能夠知道線程池是否滿過，也就是達到了maximumPoolSize；
getPoolSize：線程池當前的線程數量；
getActiveCount：當前線程池中正在執行任務的線程數量。

經過這些方法，能夠對線程池進行監控，在ThreadPoolExecutor類中提供了幾個空方法，如beforeExecute方法，afterExecute方法和terminated方法，能夠擴展這些方法在執行前或執行後增長一些新的操做，例如統計線程池的執行任務的時間等，能夠繼承自ThreadPoolExecutor來進行擴展。

總結

本文比較詳細的分析了線程池的工做流程，整體來講有以下幾個內容：

分析了線程的建立，任務的提交，狀態的轉換以及線程池的關閉；
這裏經過execute方法來展開線程池的工做流程，execute方法經過corePoolSize，maximumPoolSize以及阻塞隊列的大小來判斷決定傳入的任務應該被當即執行，仍是應該添加到阻塞隊列中，仍是應該拒絕任務。
介紹了線程池關閉時的過程，也分析了shutdown方法與getTask方法存在競態條件；
在獲取任務時，要經過線程池的狀態來判斷應該結束工做線程仍是阻塞線程等待新的任務，也解釋了爲何關閉線程池時要中斷工做線程以及爲何每個worker都須要lock。

在向線程池提交任務時，除了execute方法，還有一個submit方法，submit方法會返回一個Future對象用於獲取返回值，有關Future和Callable請自行了解一下相關的文章，這裏就不介紹了。

原文地址:http://www.ideabuffer.cn/2017/04/04/%E6%B7%B1%E5%85%A5%E7%90%86%E8%A7%A3Java%E7%BA%BF%E7%A8%8B%E6%B1%A0%EF%BC%9AThreadPoolExecutor/