2016年07月恰逢美團點評的業務進入「下半場」,須要咱們在各個環節優化體驗、提高效率、下降成本。技術團隊須要怎麼作來適應這個變化?這個問題直接影響着以後的工做思路。react
美團外賣的CRM業務步入成熟期,規則類需求幾乎撐起了這個業務全部需求的半邊天。一方面規則惟一不變的是「多變」,另外一方面開發團隊對「規則開發」的感覺是乏味、疲憊和缺少技術含量。如何解決規則開發的效率問題,最大化解放開發團隊成爲目前的一個KPI。sql
規則引擎做爲常見的維護策略規則的框架很快進入個人思路。它能將業務決策邏輯從系統邏輯中抽離出來,使兩種邏輯能夠獨立於彼此而變化,這樣能夠明顯下降兩種邏輯的維護成本。數據庫
分析規則引擎如何設計正是本文的主題,過程當中也簡單介紹了實現方案。編程
首先回顧幾個美團點評的業務場景。經過這些場景你們能更好地理解什麼是規則,規則的邊界是什麼。在每一個場景後面都介紹了業務系統如今使用的解決方案以及主要的優缺點。緩存
美團點評合併前的美團平臺事業部中,門店信息入口做爲門店信息的第一道關卡,有一個很重要的職責,就是質量控制,其中第一步就是針對一些字段的校驗規則。安全
下面從流程的角度看下門店信息入口業務裏校驗門店信息的規則模型(已簡化),以下圖。併發
規則主體包括3部分:框架
因爲歷史緣由,門店信息校驗採用了硬編碼的方式,僞代碼以下:編程語言
if (StringUtil.isBlank(fieldA) || StringUtil.isBlank(fieldB) || StringUtil.isBlank(fieldC) || StringUtil.isBlank(fieldD)) { return ResultDOFactory.createResultDO(Code.PARAM_ERROR, "門店參數缺乏必填項"); } if (fieldA.length() < 10) { return ResultDOFactory.createResultDO(Code.PARAM_ERROR, "門店名稱長度不能少於10個字符"); } if (!isConsistent(fieldB, fieldC, fieldD)) { return ResultDOFactory.createResultDO(Code.PARAM_ERROR, "門店xxx地址、行政區和經緯度不一致"); }
優勢ide
缺點
流程控制中心(負責在運行時根據輸入參數選擇不一樣的流程節點從而構建一個流程實例)會根據輸入門店信息中的渠道來源和品牌等特徵肯定本次審覈(不)走哪些節點,其中選擇策略的模型以下圖。
規則主體是分支條件:
通過一系列調研團隊選擇基於開源規則引擎Drools來配置流程中審覈節點的選擇策略。使用Drools後的規則配置流程以下圖。
上圖中DSL便是規則主體,規則內容以下:
rule "1.1" when poi : POI( source == 1 && brandType == 1 ) then System.out.println( "1.1 matched" ); poi.setPassedNodes(1); end rule "1.2" when poi : POI( source == 1 && brandType == 2 ) then System.out.println( "1.2 matched" ); end rule "2.1" when poi : POI( source == 2 && brandType == 1 ) then System.out.println( "2.1 matched" ); poi.setPassedNodes(2); end rule "2.2" when poi : POI( source == 2 && brandType == 2 ) then System.out.println( "2.2 matched" ); poi.setPassedNodes(3); end
在實踐中,咱們發現Drools方案有如下幾個優缺點:
優勢
缺點
因爲Drools的問題較多,最後這個方案仍是放棄了。
美團外賣業務發展很是迅速,績效指標規則須要快速迭代才能緊跟業務發展步伐。績效考覈頻率是一個月一次,所以績效規則的迭代頻率也是每個月一次。由於績效規則系統是硬編碼實現,所以開發團隊須要投入大量的人力知足規則更新需求。
2016年10月底我受績效團隊委託成立一個項目組,開發部署了一套績效指標配置系統,系統上線直接減小了產品經理和技術團隊70%的工做量。
下面咱們首先分析下績效指標計算的規則模型,以下圖。
規則主體是結構化數據處理邏輯:
績效規則主體是數據處理,但咱們認爲數據處理一樣屬於規則的範疇,所以咱們將其放在本文進行分析。
下圖是績效指標配置系統。觸發器負責定時驅動引擎進行計算;視圖負責給商業分析師提供規則配置界面,規則表達能力取決於視圖;引擎負責將配置的規則解析成Spark原語進行計算。
優勢
缺點
「案例」一節中三種落地方案的問題總結以下:
因爲「高效配置規則」是業務里長期存在的剛需,且行業內又缺少符合需求的解決方案,2017年02月我在團隊內部設立了一個虛擬小組專門負責規則引擎的設計研發。引擎設計指標是要覆蓋工做中基礎的規則迭代需求(包括但不限於「案例」一節中的多個場景),同時針對「案例」一節中已有解決方案揚長避短。下面分3節來重現這個項目的設計過程。首先「需求模型」一節會基於「案例」一節的場景嘗試抽象出規則模型,同時提煉出系統設計大綱。而後「Maze框架」一節會基於需求模型設計一個規則引擎。最後「Maze框架能力模型」一節會介紹Maze框架的特色。
對規則引擎來講,世界皆規則。經過「案例」一節的分析,咱們對規則以及規則引擎該如何構建的思路正逐漸變得清晰,下面兩節分別定義規則數據模型和規則引擎的系統模型,目標是對「Maze框架」一節中的規則引擎產品進行框架性指導。
規則本質是一個函數,由n個輸入、1個輸出和函數計算邏輯3部分組成。
y = f(x1, x2, …, xn)
具體結合「案例」一節中的場景咱們梳理出的規則模型以下圖所示。
主要由三部分構成:
FACT對象:用戶輸入的事實對象,做爲決策因子使用。
規則:LHS(Left Hand Side)部分即條件分支邏輯。RHS(Right Hand Side)部分即執行邏輯。LHS和RHS部分是由一個或多個模式構成的。模式是規則內最小單位。模式的輸入參數能夠是另外一個模式或FACT對象(好比邏輯與運算[參數1] && [參數2]
中參數1能夠是另外一個表達式)。模式須要支持如下3種類別:
結果對象:規則處理完畢後的結果。須要支持自定義類型或者簡單類型(Integer、Long、Float、Double、Short、String、Boolean等)。
咱們須要設計一個系統能配置、加載、解釋執行上節中的數據模型,另外設計時還須要規避「案例」一節3個方案的缺點。最終咱們定義了以下圖所示的系統模型。
主要由3個模塊構成。
知識庫:負責提供配置視圖和模式因子。知識庫之因此叫「知識」庫一個很重要的特徵是知識庫能夠低成本擴展知識。知識擴展包括視圖和模式的添加,視圖和模式有一對一映射關係,好比咱們在界面上展現一個如:大於小於等於同樣的視圖,則必定有一個模式$參數1 > $參數2
與之對應。
資源管理器:負責管理規則。
$參數1 + $參數2 > $參數3
這樣的規則即是由多個模式「複合」而成,則他的依賴關係以下所示。最終結果 /** 變量模式 */ | | 中間結果 > $參數3 /** 關係運算模式 */ | | $參數1 + $參數2 /** 算數運算模式 */
基於"需求模型"一節的定義,咱們開發了Maze框架(Maze是迷宮的意思,寓意:迷宮同樣複雜的規則)。
Maze框架分兩個引擎:MazeGO(策略引擎)和MazeQL(結構化數據處理引擎)。其中MazeGO內解析到結構化數據處理模式會調用SQLC驅動MazeQL完成計算(好比:從數據庫裏查詢某個BD的月交易額,若是交易額超過30萬則執行A邏輯不然執行B邏輯,這個語義的規則即須要執行結構化查詢),MazeQL內解析到策略計算模式會調用VectorC驅動MazeGO進行計算(好比:有一張訂單表,其中第一列是商品ID,第二列是商品購買數量,第三列是此商品的單價,咱們須要計算每類商品的總價則須要對結構化查詢到的結果的每一行執行第二列
* 第三列
這樣的策略模式計算)。
名詞解釋:
MazeGO核心主要由3部分構成:資源管理器、知識庫和MazeGO引擎。另外兩個輔助模塊是流量控制器和規則效果分析模塊。基本構成以下圖。
3個核心模塊(引擎、知識庫和資源管理器)的職責見「需求模型」一節中「系統模型」一節。下面只介紹下和「系統模型」不一樣的部分。
MazeQL核心主要由3部分構成:配置中心、MazeQL引擎和平臺。
Maze框架是一個適用於非技術背景人員,支持複雜規則的配置和計算引擎。
規則支持熱部署:系統經過版本控制,能夠灰度一部分流量,增長上線信心。
框架的表達能力覆蓋絕大部分代碼表達能力。下面用僞代碼的形式展現下Maze框架的規則部分具備的能力。
// 輸入N個FACT對象 function(Fact[] facts) { // 從FACT對象裏提取模式 String xx= facts[0].xx; // 從某個數據源獲取特徵數據,SQLC數據處理能力遠超sql語言自己能力,SQLC具備編程+SQL的混合能力 List<Fact> moreFacts = connection.executeQuery("select * from xxx where xx like '%" + xx + "%'); // 對特徵數據和FACT對象應用用戶自定義計算模式 UserDefinedClass userDefinedObj = userDefinedFuntion(facts, moreFacts); // 使用系統內置表達式模式處理特徵 int compareResult = userDefinedObj.getFieldXX().compare(XX); // 聲明用戶自定義對象 UserDefinedResultClass userDefinedResultObj = new UserDefinedResultClass(); // 使用系統內置條件語句模式處理特徵 if (compareResult == 0) { userDefinedResultObj.setCompareResult(Boolean.FALSE); } else if (compareResult > 0) { userDefinedResultObj.setCompareResult(Boolean.FALSE); } else { userDefinedResultObj.setCompareResult(Boolean.TRUE); } // 將結果返回給客戶 return userDefinedResultObj; }
執行效率分三方面:
而後,開發人員在項目工程裏須要調用計算規則的地方引入MazeGO client(以下代碼片斷)。
// 初始化MazeGO client,建議在本應用程序的初始化階段執行 MazeGOReactor reactor = new MazeGOReactor(); reactor.setMazeIds(Arrays.asList(<mazeId>)); reactor.init(); // 調用MazeGO client執行規則 reactor.go(<mazeId>, <fact>); // 銷燬MazeGO client,建議在本應用程序的銷燬階段執行 reactor.destroy();
規則配置基本實現由業務分析師、產品經理或運營人員自助完成。
業務分析師在MazeGO上配置規則的視圖以下圖所示。
本文開頭介紹了幾個工做中的規則使用場景,順帶引出了多個不一樣的解決方案,最後介紹了Maze框架的設計,基本上展示了咱們對這個框架思考和設計的整個過程。
張寧,美團點評技術專家。2015年加入美團,前後在美團數據中心、外賣CRM等業務線工做,目前在外賣技術部,負責代理商和CRM效能相關業務,致力於經過技術手段提高商務拓展團隊的工做效率、下降客戶關係維護成本。
【思考題】
世界皆規則,業務開發工程師的平常工做又都是實現業務邏輯。那當通用規則引擎表達能力可以覆蓋大部分業務邏輯,且配置成本低於開發工程師直接開發時,業務邏輯這一畝三分地裏通用規則引擎和代碼的邊界是什麼?咱們是否還須要嚴格恪守規則引擎只是用來「隔離變化」、「解耦決策邏輯」等原則?