延遲任務的實現總結

時間 2020-05-03

標籤延遲任務實現總結简体版

原文原文鏈接

延遲任務有別於定式任務，定式任務每每是固定週期的，有明確的觸發時間。而延遲任務通常沒有固定的開始時間，它經常是由一個事件觸發的，而在這個事件觸發以後的一段時間內觸發另外一個事件。延遲任務相關的業務場景以下：html

場景一：物聯網系統常常會遇到向終端下發命令，若是命令一段時間沒有應答，就須要設置成超時。java

場景二：訂單下單以後30分鐘後，若是用戶沒有付錢，則系統自動取消訂單。redis

下面咱們來探討一些方案，其實這些方案沒有好壞之分，和系統架構同樣，只有最適合。對於數據量較小的狀況下，任意一種方案均可行，考慮的是簡單明瞭和開發速度，儘可能避免把系統搞複雜了。而對於數據量較大的狀況下，就須要有一些選擇，並非全部的方案都適合了。算法

1. 數據庫輪詢

這是比較常見的一種方式，全部的訂單或者全部的命令通常都會存儲在數據庫中。咱們會起一個線程去掃數據庫或者一個數據庫定時Job，找到那些超時的數據，直接更新狀態，或者拿出來執行一些操做。這種方式很簡單，不會引入其餘的技術，開發週期短。數據庫

若是數據量比較大，千萬級甚至更多，插入頻率很高的話，上面的方式在性能上會出現一些問題，查找和更新對會佔用不少時間，輪詢頻率高的話甚至會影響數據入庫。一種能夠嘗試的方式就是使用相似TBSchedule或Elastic-Job這樣的分佈式的任務調度加上數據分片功能，把須要判斷的數據分到不一樣的機器上執行。數組

若是數據量進一步增大，那掃數據庫確定就不行了。另外一方面，對於訂單這類數據，咱們也許會遇到分庫分表，那上述方案就會變得過於複雜，得不償失。安全

2. JDK延遲隊列

Java中的DelayQueue位於java.util.concurrent包下，做爲單機實現，它很好的實現了延遲一段時間後觸發事件的需求。因爲是線程安全的它能夠有多個消費者和多個生產者，從而在某些狀況下能夠提高性能。DelayQueue本質是封裝了一個PriorityQueue，使之線程安全，加上Delay功能，也就是說，消費者線程只能在隊列中的消息「過時」以後才能返回數據獲取到消息，否則只能獲取到null。服務器

之因此要用到PriorityQueue，主要是須要排序。也許後插入的消息須要比隊列中的其餘消息提早觸發，那麼這個後插入的消息就須要最早被消費者獲取，這就須要排序功能。PriorityQueue內部使用最小堆來實現排序隊列。隊首的，最早被消費者拿到的就是最小的那個。使用最小堆讓隊列在數據量較大的時候比較有優點。使用最小堆來實現優先級隊列主要是由於最小堆在插入和獲取時，時間複雜度相對都比較好，都是O(logN)。網絡

下面例子實現了將來某個時間要觸發的消息。我把這些消息放在DelayQueue中，當消息的觸發時間到，消費者就能拿到消息，而且消費，實現處理方法。示例代碼：數據結構

/* * 定義放在延遲隊列中的對象，須要實現Delayed接口 */
public class DelayedTask implements Delayed { private int _expireInSecond = 0; public DelayedTask(int delaySecond) { Calendar cal = Calendar.getInstance(); cal.add(Calendar.SECOND, delaySecond); _expireInSecond = (int) (cal.getTimeInMillis() / 1000); } public int compareTo(Delayed o) { long d = (getDelay(TimeUnit.NANOSECONDS) - o.getDelay(TimeUnit.NANOSECONDS)); return (d == 0) ? 0 : ((d < 0) ? -1 : 1); } public long getDelay(TimeUnit unit) { // TODO Auto-generated method stub
 Calendar cal = Calendar.getInstance(); return _expireInSecond - (cal.getTimeInMillis() / 1000); } }

下面定義了三個延遲任務，分別是10秒，5秒和15秒。依次入隊列，指望5秒鐘後，5秒的消息先被獲取到，而後每一個5秒鐘，依次獲取到10秒數據和15秒的那個數據。

public static void main(String[] args) throws InterruptedException { // TODO Auto-generated method stub
 SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); //定義延遲隊列
        DelayQueue<DelayedTask> delayQueue = new DelayQueue<DelayedTask>(); //定義三個延遲任務
        DelayedTask task1 = new DelayedTask(10); DelayedTask task2 = new DelayedTask(5); DelayedTask task3 = new DelayedTask(15); delayQueue.add(task1); delayQueue.add(task2); delayQueue.add(task3); System.out.println(sdf.format(new Date()) + " start"); while (delayQueue.size() != 0) { //若是沒到時間，該方法會返回
            DelayedTask task = delayQueue.poll(); if (task != null) { Date now = new Date(); System.out.println(sdf.format(now)); } Thread.sleep(1000); } }

輸出結果以下圖：

DelayQueue是一種很好的實現方式，雖然是單機，可是能夠多線程生產和消費，提升效率。拿到消息後也可使用異步線程去執行下一步的任務。若是有分佈式的需求可使用Redis來實現消息的分發，若是對消息的可靠性有很是高的要求可使用消息中間件：

使用DelayQueue須要考慮程序掛掉以後，內存裏面未處理消息的丟失帶來的影響。

3. JDK ScheduledExecutorService

JDK自帶的一種線程池，它能調度一些命令在一段時間以後執行，或者週期性的執行。文章開頭的一些業務場景主要使用第一種方式，即，在一段時間以後執行某個操做。代碼例子以下：

public static void main(String[] args) { // TODO Auto-generated method stub
        ScheduledExecutorService executor = Executors.newScheduledThreadPool(100); for (int i = 10; i > 0; i--) { executor.schedule(new Runnable() { public void run() { // TODO Auto-generated method stub
 System.out.println( "Work start, thread id:" + Thread.currentThread().getId() + " " + sdf.format(new Date())); } }, i, TimeUnit.SECONDS); } }

執行結果：

ScheduledExecutorService的實現類ScheduledThreadPoolExecutor提供了一種並行處理的模型，簡化了線程的調度。DelayedWorkQueue是相似DelayQueue的實現，也是基於最小堆的、線程安全的數據結構，因此會有上例排序後輸出的結果。

ScheduledExecutorService比上面一種DelayQueue更加實用。由於，通常來講，使用DelayQueue獲取消息後觸發事件都會實用多線程的方式執行，以保證其餘事件能準時進行。而ScheduledThreadPoolExecutor就是對這個過程進行了封裝，讓你們更加方便的使用。同時在增強了部分功能，好比定時觸發命令。

4. 時間輪

時間輪是一種很是驚豔的數據結構。其在Linux內核中使用普遍，是Linux內核定時器的實現方法和基礎之一。按使用場景，大體能夠分爲兩種時間輪：原始時間輪和分層時間輪。分層時間輪是原始時間輪的升級版本，來應對時間「槽」數量比較大的狀況，對內存和精度都有很高要求的狀況。咱們延遲任務的場景通常只須要用到原始時間輪就能夠了。

原始時間輪：以下圖一個輪子，有8個「槽」，能夠表明將來的一個時間。若是以秒爲單位，中間的指針每隔一秒鐘轉動到新的「槽」上面，就好像手錶同樣。若是當前指針指在1上面，我有一個任務須要4秒之後執行，那麼這個執行的線程回調或者消息將會被放在5上。那若是須要在20秒以後執行怎麼辦，因爲這個環形結構槽數只到8，若是要20秒，指針須要多轉2圈。位置是在2圈以後的5上面（20 % 8 + 1）。這個圈數須要記錄在槽中的數據結構裏面。這個數據結構最重要的是兩個指針，一個是觸發任務的函數指針，另一個是觸發的總第幾圈數。時間輪能夠用簡單的數組或者是環形鏈表來實現。

相比DelayQueue的數據結構，時間輪在算法複雜度上有必定優點。DelayQueue因爲涉及到排序，須要調堆，插入和移除的複雜度是O(lgn)，而時間輪在插入和移除的複雜度都是O(1)。

時間輪比較好的開源實現是Netty的

// 建立Timer, 精度爲100毫秒,
        HashedWheelTimer timer = new HashedWheelTimer(); System.out.println(sdf.format(new Date())); MyTask task1 = new MyTask(); MyTask task2 = new MyTask(); MyTask task3 = new MyTask(); timer.newTimeout(task1, 5, TimeUnit.SECONDS); timer.newTimeout(task2, 10, TimeUnit.SECONDS); timer.newTimeout(task3, 15, TimeUnit.SECONDS); // 阻塞main線程
        try { System.in.read(); } catch (IOException e) { // TODO Auto-generated catch block
 e.printStackTrace(); }

其中HashedWheelTimer有多個構造函數。其中：

ThreadFactory ：建立線程的類，默認Executors.defaultThreadFactory()。

TickDuration：多少時間指針順時針轉一格，單位由下面一個參數提供。

TimeUnit：上一個參數的時間單位。

TicksPerWheel：時間輪上的格子數。

若是一個任務要在120s後執行，時間輪是默認參數的話，那麼這個任務在時間輪上須要通過

120000ms / (512 * 100ms) = 2輪

120000ms % (512 * 100ms) = 176格。

在使用HashedWheelTimer的過程當中，延遲任務的實現最好使用異步的，HashedWheelTimer的任務管理和執行都在一個線程裏面。若是任務比較耗時，那麼指針就會延遲，致使整個任務就會延遲。

4. Quartz

quartz是一個企業級的開源的任務調度框架，quartz內部使用TreeSet來保存Trigger，以下圖。Java中的TreeSet是使用TreeMap實現，TreeMap是一個紅黑樹實現。紅黑樹的插入和刪除複雜度都是logN。和最小堆相比各有千秋。最小堆插入比紅黑樹快，刪除頂層節點比紅黑樹慢。

相比上述的三種輕量級的實現功能豐富不少。有專門的任務調度線程，和任務執行線程池。quartz功能強大，主要是用來執行週期性的任務，固然也能夠用來實現延遲任務。可是若是隻是實現一個簡單的基於內存的延時任務的話，quartz就稍顯龐大。

5. Redis ZSet

Redis中的ZSet是一個有序的Set，內部使用HashMap和跳錶(SkipList)來保證數據的存儲和有序，HashMap裏放的是成員到score的映射，而跳躍表裏存放的是全部的成員，排序依據是HashMap裏存的score,使用跳躍表的結構能夠得到比較高的查找效率，而且在實現上比較簡單。

public class ZSetTest { private JedisPool jedisPool = null; // Redis服務器IP
    private String ADDR = "10.23.22.42"; // Redis的端口號
    private int PORT = 6379; private SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void intJedis() { jedisPool = new JedisPool(ADDR, PORT); } public static void main(String[] args) { // TODO Auto-generated method stub
 ZSetTest zsetTest = new ZSetTest(); zsetTest.intJedis(); zsetTest.addItem(); zsetTest.getItem(); zsetTest.deleteZSet(); } public void deleteZSet() { Jedis jedis = jedisPool.getResource(); jedis.del("zset_test"); } public void addItem() { Jedis jedis = jedisPool.getResource(); Calendar cal1 = Calendar.getInstance(); cal1.add(Calendar.SECOND, 10); int second10later = (int) (cal1.getTimeInMillis() / 1000); Calendar cal2 = Calendar.getInstance(); cal2.add(Calendar.SECOND, 20); int second20later = (int) (cal2.getTimeInMillis() / 1000); Calendar cal3 = Calendar.getInstance(); cal3.add(Calendar.SECOND, 30); int second30later = (int) (cal3.getTimeInMillis() / 1000); Calendar cal4 = Calendar.getInstance(); cal4.add(Calendar.SECOND, 40); int second40later = (int) (cal4.getTimeInMillis() / 1000); Calendar cal5 = Calendar.getInstance(); cal5.add(Calendar.SECOND, 50); int second50later = (int) (cal5.getTimeInMillis() / 1000); jedis.zadd("zset_test", second50later, "e"); jedis.zadd("zset_test", second10later, "a"); jedis.zadd("zset_test", second30later, "c"); jedis.zadd("zset_test", second20later, "b"); jedis.zadd("zset_test", second40later, "d"); System.out.println(sdf.format(new Date()) + " add finished."); } public void getItem() { Jedis jedis = jedisPool.getResource(); while (true) { try { Set<Tuple> set = jedis.zrangeWithScores("zset_test", 0, 0); String value = ((Tuple) set.toArray()[0]).getElement(); int score = (int) ((Tuple) set.toArray()[0]).getScore(); Calendar cal = Calendar.getInstance(); int nowSecond = (int) (cal.getTimeInMillis() / 1000); if (nowSecond >= score) { jedis.zrem("zset_test", value); System.out.println(sdf.format(new Date()) + " removed value:" + value); } if (jedis.zcard("zset_test") <= 0) { System.out.println(sdf.format(new Date()) + " zset empty "); return; } Thread.sleep(1000); } catch (InterruptedException e) { // TODO Auto-generated catch block
 e.printStackTrace(); } } } }

在用做延遲任務的時候，能夠在添加數據的時候，使用zadd把score寫成將來某個時刻的unix時間戳。消費者使用zrangeWithScores獲取優先級最高的（最先開始的的）任務。注意，zrangeWithScores並非取出來，只是看一下並不刪除，相似於Queue的peek方法。程序對最先的這個消息進行驗證，是否到達要運行的時間，若是是則執行，而後刪除zset中的數據。若是不是，則繼續等待。

因爲zrangeWithScores 和 zrem是前後使用，因此有可能有併發問題，即兩個線程或者兩個進程都會拿到同樣的同樣的數據，而後重複執行，最後又都會刪除。若是是單機多線程執行，或者分佈式環境下，可使用Redis事務，也可使用由Redis實現的分佈式鎖，或者使用下例中Redis Script。你能夠在Redis官方的Transaction章節找到事務的相關內容。

使用Redis的好處主要是：

1. 解耦：把任務、任務發起者、任務執行者的三者分開，邏輯更加清晰，程序強壯性提高，有利於任務發起者和執行者各自迭代，適合多人協做。

2. 異常恢復：因爲使用Redis做爲消息通道，消息都存儲在Redis中。若是發送程序或者任務處理程序掛了，重啓以後，還有從新處理數據的可能性。

3. 分佈式：若是數據量較大，程序執行時間比較長，咱們能夠針對任務發起者和任務執行者進行分佈式部署。特別注意任務的執行者，也就是Redis的接收方須要考慮分佈式鎖的問題。

6. Jesque

Jesque是Resque的java實現，Resque是一個基於Redis的Ruby項目，用於後臺的定時任務。Jesque實現延遲任務的方法也是在Redis裏面創建一個ZSet，和上例同樣的處理方式。上例提到在使用ZSet做爲優先級隊列的時候，因爲zrangeWithScores 和 zrem無法保證原子性，全部在分佈式環境下會有問題。在Jesque中，它使用的Redis Script來解決這個問題。Redis Script能夠保證操做的原子性，相比事務也減小了一些網絡開銷，性能更加出色。

7. RabbitMQ TTL和DXL

使用RabbitMQ的TTL和DXL實現延遲隊列在這裏不作詳細的介紹，這篇文章描述的比較詳細。

綜上所述，解決延遲隊列有不少種方法。選擇哪一個解決方案也須要根據不一樣的數據量、實時性要求、已有架構和組件等因素進行判斷和取捨。對於比較簡單的系統，可使用數據庫輪訓的方式。數據量稍大，實時性稍高一點的系統可使用JDK延遲隊列（也許須要解決程序掛了，內存中未處理任務丟失的狀況）。若是須要分佈式橫向擴展的話推薦使用Redis的方案。可是對於系統中已有RabbitMQ，那RabbitMQ會是一個更好的方案。

轉自：http://www.cnblogs.com/haoxinyue/p/6663720.html

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。