如何優雅的使用和理解線程池

前言

平時接觸過多線程開發的童鞋應該都或多或少了解過線程池,以前發佈的《阿里巴巴 Java 手冊》裏也有一條:java

可見線程池的重要性。git

簡單來講使用線程池有如下幾個目的:github

  • 線程是稀缺資源,不能頻繁的建立。
  • 解耦做用;線程的建立於執行徹底分開,方便維護。
  • 應當將其放入一個池子中,能夠給其餘任務進行復用。

線程池原理

談到線程池就會想到池化技術,其中最核心的思想就是把寶貴的資源放到一個池子中;每次使用都從裏面獲取,用完以後又放回池子供其餘人使用,有點吃大鍋飯的意思。api

那在 Java 中又是如何實現的呢?多線程

在 JDK 1.5 以後推出了相關的 api,常見的建立線程池方式有如下幾種:併發

  • Executors.newCachedThreadPool():無限線程池。
  • Executors.newFixedThreadPool(nThreads):建立固定大小的線程池。
  • Executors.newSingleThreadExecutor():建立單個線程的線程池。

其實看這三種方式建立的源碼就會發現:異步

public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>());
    }

實際上仍是利用 ThreadPoolExecutor 類實現的。ide

因此咱們重點來看下 ThreadPoolExecutor 是怎麼玩的。函數

首先是建立線程的 api:測試

ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, RejectedExecutionHandler handler)

這幾個核心參數的做用:

  • corePoolSize 爲線程池的基本大小。
  • maximumPoolSize 爲線程池最大線程大小。
  • keepAliveTimeunit 則是線程空閒後的存活時間。
  • workQueue 用於存聽任務的阻塞隊列。
  • handler 當隊列和最大線程池都滿了以後的飽和策略。

瞭解了這幾個參數再來看看實際的運用。

一般咱們都是使用:

threadPool.execute(new Job());

這樣的方式來提交一個任務到線程池中,因此核心的邏輯就是 execute() 函數了。

在具體分析以前先了解下線程池中所定義的狀態,這些狀態都和線程的執行密切相關:

  • RUNNING 天然是運行狀態,指能夠接受任務執行隊列裏的任務
  • SHUTDOWN 指調用了 shutdown() 方法,再也不接受新任務了,可是隊列裏的任務得執行完畢。
  • STOP 指調用了 shutdownNow() 方法,再也不接受新任務,同時拋棄阻塞隊列裏的全部任務並中斷全部正在執行任務。
  • TIDYING 全部任務都執行完畢,在調用 shutdown()/shutdownNow() 中都會嘗試更新爲這個狀態。
  • TERMINATED 終止狀態,當執行 terminated() 後會更新爲這個狀態。

用圖表示爲:

而後看看 execute() 方法是如何處理的:

  1. 獲取當前線程池的狀態。
  2. 當前線程數量小於 coreSize 時建立一個新的線程運行。
  3. 若是當前線程處於運行狀態,而且寫入阻塞隊列成功。
  4. 雙重檢查,再次獲取線程狀態;若是線程狀態變了(非運行狀態)就須要從阻塞隊列移除任務,並嘗試判斷線程是否所有執行完畢。同時執行拒絕策略。
  5. 若是當前線程池爲空就新建立一個線程並執行。
  6. 若是在第三步的判斷爲非運行狀態,嘗試新建線程,若是失敗則執行拒絕策略。

這裏藉助《聊聊併發》的一張圖來描述這個流程:

如何配置線程

流程聊完了再來看看上文提到了幾個核心參數應該如何配置呢?

有一點是確定的,線程池確定是否是越大越好。

一般咱們是須要根據這批任務執行的性質來肯定的。

  • IO 密集型任務:因爲線程並非一直在運行,因此能夠儘量的多配置線程,好比 CPU 個數 * 2
  • CPU 密集型任務(大量複雜的運算)應當分配較少的線程,好比 CPU 個數至關的大小。

固然這些都是經驗值,最好的方式仍是根據實際狀況測試得出最佳配置。

優雅的關閉線程池

有運行任務天然也有關閉任務,從上文提到的 5 個狀態就能看出如何來關閉線程池。

其實無非就是兩個方法 shutdown()/shutdownNow()

但他們有着重要的區別:

  • shutdown() 執行後中止接受新任務,會把隊列的任務執行完畢。
  • shutdownNow() 也是中止接受新任務,但會中斷全部的任務,將線程池狀態變爲 stop。
兩個方法都會中斷線程,用戶可自行判斷是否須要響應中斷。

shutdownNow() 要更簡單粗暴,能夠根據實際場景選擇不一樣的方法。

我一般是按照如下方式關閉線程池的:

long start = System.currentTimeMillis();
        for (int i = 0; i <= 5; i++) {
            pool.execute(new Job());
        }

        pool.shutdown();

        while (!pool.awaitTermination(1, TimeUnit.SECONDS)) {
            LOGGER.info("線程還在執行。。。");
        }
        long end = System.currentTimeMillis();
        LOGGER.info("一共處理了【{}】", (end - start));

pool.awaitTermination(1, TimeUnit.SECONDS) 會每隔一秒鐘檢查一次是否執行完畢(狀態爲 TERMINATED),當從 while 循環退出時就代表線程池已經徹底終止了。

SpringBoot 使用線程池

2018 年了,SpringBoot 盛行;來看看在 SpringBoot 中應當怎麼配置和使用線程池。

既然用了 SpringBoot ,那天然得發揮 Spring 的特性,因此須要 Spring 來幫咱們管理線程池:

@Configuration
public class TreadPoolConfig {


    /**
     * 消費隊列線程
     * @return
     */
    @Bean(value = "consumerQueueThreadPool")
    public ExecutorService buildConsumerQueueThreadPool(){
        ThreadFactory namedThreadFactory = new ThreadFactoryBuilder()
                .setNameFormat("consumer-queue-thread-%d").build();

        ExecutorService pool = new ThreadPoolExecutor(5, 5, 0L, TimeUnit.MILLISECONDS,
                new ArrayBlockingQueue<Runnable>(5),namedThreadFactory,new ThreadPoolExecutor.AbortPolicy());

        return pool ;
    }



}

使用時:

@Resource(name = "consumerQueueThreadPool")
    private ExecutorService consumerQueueThreadPool;


    @Override
    public void execute() {

        //消費隊列
        for (int i = 0; i < 5; i++) {
            consumerQueueThreadPool.execute(new ConsumerQueueThread());
        }

    }

其實也挺簡單,就是建立了一個線程池的 bean,在使用時直接從 Spring 中取出便可。

監控線程池

談到了 SpringBoot,也可利用它 actuator 組件來作線程池的監控。

線程怎麼說都是稀缺資源,對線程池的監控能夠知道本身任務執行的情況、效率等。

關於 actuator 就再也不細說了,感興趣的能夠看看這篇,有詳細整理過如何暴露監控端點。

其實 ThreadPool 自己已經提供了很多 api 能夠獲取線程狀態:

不少方法看名字就知道其含義,只須要將這些信息暴露到 SpringBoot 的監控端點中,咱們就能夠在可視化頁面查看當前的線程池狀態了。

甚至咱們能夠繼承線程池擴展其中的幾個函數來自定義監控邏輯:

看這些名稱和定義都知道,這是讓子類來實現的。

能夠在線程執行前、後、終止狀態執行自定義邏輯。

線程池隔離

線程池看似很美好,但也會帶來一些問題。

若是咱們不少業務都依賴於同一個線程池,當其中一個業務由於各類不可控的緣由消耗了全部的線程,致使線程池所有佔滿。

這樣其餘的業務也就不能正常運轉了,這對系統的打擊是巨大的。

好比咱們 Tomcat 接受請求的線程池,假設其中一些響應特別慢,線程資源得不到回收釋放;線程池慢慢被佔滿,最壞的狀況就是整個應用都不能提供服務。

因此咱們須要將線程池進行隔離

一般的作法是按照業務進行劃分:

好比下單的任務用一個線程池,獲取數據的任務用另外一個線程池。這樣即便其中一個出現問題把線程池耗盡,那也不會影響其餘的任務運行。

hystrix 隔離

這樣的需求 Hystrix 已經幫咱們實現了。

Hystrix 是一款開源的容錯插件,具備依賴隔離、系統容錯降級等功能。

下面來看看 Hystrix 簡單的應用:

首先須要定義兩個線程池,分別用於執行訂單、處理用戶。

/**
 * Function:訂單服務
 *
 * @author crossoverJie
 *         Date: 2018/7/28 16:43
 * @since JDK 1.8
 */
public class CommandOrder extends HystrixCommand<String> {

    private final static Logger LOGGER = LoggerFactory.getLogger(CommandOrder.class);

    private String orderName;

    public CommandOrder(String orderName) {


        super(Setter.withGroupKey(
                //服務分組
                HystrixCommandGroupKey.Factory.asKey("OrderGroup"))
                //線程分組
                .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("OrderPool"))

                //線程池配置
                .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter()
                        .withCoreSize(10)
                        .withKeepAliveTimeMinutes(5)
                        .withMaxQueueSize(10)
                        .withQueueSizeRejectionThreshold(10000))

                .andCommandPropertiesDefaults(
                        HystrixCommandProperties.Setter()
                                .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD))
        )
        ;
        this.orderName = orderName;
    }


    @Override
    public String run() throws Exception {

        LOGGER.info("orderName=[{}]", orderName);

        TimeUnit.MILLISECONDS.sleep(100);
        return "OrderName=" + orderName;
    }


}


/**
 * Function:用戶服務
 *
 * @author crossoverJie
 *         Date: 2018/7/28 16:43
 * @since JDK 1.8
 */
public class CommandUser extends HystrixCommand<String> {

    private final static Logger LOGGER = LoggerFactory.getLogger(CommandUser.class);

    private String userName;

    public CommandUser(String userName) {


        super(Setter.withGroupKey(
                //服務分組
                HystrixCommandGroupKey.Factory.asKey("UserGroup"))
                //線程分組
                .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("UserPool"))

                //線程池配置
                .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter()
                        .withCoreSize(10)
                        .withKeepAliveTimeMinutes(5)
                        .withMaxQueueSize(10)
                        .withQueueSizeRejectionThreshold(10000))

                //線程池隔離
                .andCommandPropertiesDefaults(
                        HystrixCommandProperties.Setter()
                                .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD))
        )
        ;
        this.userName = userName;
    }


    @Override
    public String run() throws Exception {

        LOGGER.info("userName=[{}]", userName);

        TimeUnit.MILLISECONDS.sleep(100);
        return "userName=" + userName;
    }


}

api 特別簡潔易懂,具體詳情請查看官方文檔。

而後模擬運行:

public static void main(String[] args) throws Exception {
        CommandOrder commandPhone = new CommandOrder("手機");
        CommandOrder command = new CommandOrder("電視");


        //阻塞方式執行
        String execute = commandPhone.execute();
        LOGGER.info("execute=[{}]", execute);

        //異步非阻塞方式
        Future<String> queue = command.queue();
        String value = queue.get(200, TimeUnit.MILLISECONDS);
        LOGGER.info("value=[{}]", value);


        CommandUser commandUser = new CommandUser("張三");
        String name = commandUser.execute();
        LOGGER.info("name=[{}]", name);
    }

運行結果:

能夠看到兩個任務分紅了兩個線程池運行,他們之間互不干擾。

獲取任務任務結果支持同步阻塞和異步非阻塞方式,可自行選擇。

它的實現原理其實容易猜到:

利用一個 Map 來存放不一樣業務對應的線程池。

經過剛纔的構造函數也能證實:

還要注意的一點是:

自定義的 Command 並非一個單例,每次執行須要 new 一個實例,否則會報 This instance can only be executed once. Please instantiate a new instance. 異常。

總結

池化技術確實在平時應用普遍,熟練掌握能提升很多效率。

文末的 hystrix 源碼:

https://github.com/crossoverJie/Java-Interview/tree/master/src/main/java/com/crossoverjie/hystrix

最後插播個小廣告:

Java-Interview 截止目前將近 8K star。

此次定個小目標:爭取衝擊 1W star

感謝各位老鐵的支持與點贊。

歡迎關注公衆號一塊兒交流:

相關文章
相關標籤/搜索