#研發解決方案#分佈式並行計算調度和管理系統Summoner

時間 2019-11-05

標籤研發解決方案分佈式並行計算調度管理系統 summoner 欄目系統架構简体版

原文原文鏈接

鄭昀建立於2015/11/10 最後更新於2015/11/12

關鍵詞：佣金計算、定時任務、數據抽取、數據清洗、數據計算、Java、Redis、MySQL、Zookeeper、azkaban二、oozie、mesos

Summoner 是國璽部門推出的基於 MySQL+Redis+Zookeeper 的分佈式並行計算調度和管理系統，李紅紅主設。

0x00，爲何要作「數據」並行計算調度？

你們均可能作過 基於 MySQL 數據庫的，大規模的、有步驟的、步驟與步驟之間有依賴關係的數據計算。你可能定義了一堆彼此依賴的定時任務，也可能寫成一個大進程跑。

舉一個實際場景吧，在咱們 O2O 業務體系下，我要作人員規模三四千人、有多條業務線、組織結構爲大區-區域-城市-銷售組的銷售團隊的昨日佣金和當月佣金，這裏的挑戰是：

涉及到商戶、門店、交易、折扣、覈銷物料等等，數據量很大，至少天天都要算一次，要算得快，
激勵政策和佣金計算公式隨着競爭態勢變化，通常一兩個月變一次，
數據抽取儘量少影響正常業務，
計算邏輯調整後要能快速部署和運行。

那麼，之前可能會定義一些定時任務，天天凌晨從各個業務數據庫（畢竟全都拆庫分表了）裏抽取：

人員組織架構
大區、區域和城市的對照關係
合同以及合同擁有者
商戶和門店
門店下的收單交易
佣金計算公式、規則以及各類權重因子
……

既有全量數據，也有增量數據，因此數據量是很大的。

先算簽約數、開店數、交易量等，再把業績歸結在 BD 身上，根據不一樣業務線的佣金計算公式依次對 BD、BD主管、城市經理等展開各類計算。

雖然咱們的 JobCenter 是很優秀的定時任務調度和管理平臺，但它沒有步驟（即定時任務之間的依賴關係）的概念，因此之前咱們只好拍腦殼定 Job1 凌晨1點執行，Job2 凌晨2點執行，Job3和Job4放在3點執行，顯然這只是無奈之舉，萬一 Job1 跑到凌晨3點纔算完怎麼辦？萬一 Job1 執行失敗了怎麼辦？

什麼是步驟？咱們能夠用下圖來理解一個大計算任務下步驟之間的依賴關係：

圖1

爲了應對這種數據量很大的抽取和一環套一環的計算，咱們須要 另行發展一個界面友好的、有步驟概念的、有集羣調度的數據計算系統，以充分利用機器資源。

0x01，他山之玉：azkaban2/oozie/mesos

計算資源的調度，好學生有很多，如針對 hadoop 集羣調度和管理的 azkaban2 和 oozie，抽象能力更高的分佈式資源管理框架 apache mesos。

項目開始之初，我但願借鑑 oozie 和 azkaban2 的一些優秀設計思路，咱們其實也是作調度和管理，只不過它們基於 hadoop，咱們基於 mysql 而已。

給我深入印象的調度系統特性有：

計算任務有步驟定義，輸入輸出都有靈活的定義，適合於數據收集、清洗、聚合、計算等各類常見計算場景；
步驟能夠經過依賴關係來定義串行仍是並行；
能夠很直觀地看到當前任務執行時跑到了哪個步驟，或者哪些計算小任務；

如 oozie 的界面

能夠很直觀地收集和展現當前任務裏的輸出流以及異常日誌流；
能夠很方便地暫停、終止、重啓任務，無需擔憂遺留垃圾中間數據；
有報警機制，有一些簡單指標展現；
計算任務的步驟定義視覺化

如 azkaban2 的界面

因而，國璽李紅紅他們開始動手設計。最終出來的效果還不錯，下面介紹一下。

後來咱們的容器私有云用了 apache mesos，我以爲 mesos 這種高度抽象的資源調度和管理系統很是適合咱們的數據並行計算應用場景，因而假想了一番：咱們寫調度器去和 mesos 通訊，告訴它要去執行什麼命令，它去負責在整個 cluster 裏調度；咱們寫的工程以及控制檯有點兒像 marathon，依託於 mesos+chronos；咱們寫的從不一樣數據源抽取原始數據、計算佣金的代碼，打成 jar 包後放在 mesos master 上，配置好後，mesos slave 真的接到調度指令去運行時，會本身從 master 節點下載 jar 包並執行，blabla……這樣 mesos 能替咱們省了很多開發工做。