DatwWorks終於升級2.0了,心情萬分激動之餘,又有一絲擔心。由於,無法再建立新的舊版工做流了。。。
新版拋棄了「工做流」這個概念,引入了「業務流程」和「解決方案」兩個新的概念。因而,做爲團隊Leader,我花了很大的精力去鑽研這兩個概念到底該如何應用在個人實際業務中。數據庫
1.目的
能儘快應用DataWorks2.0的諸多給力新功能;
儘快解決掉因爲沒法新建舊版工做流引發的不便;機器學習
2.舊版工做流劃分
任務節點通常分爲如下幾類:學習
- 源數據同步節點
- 單業務基礎數據層統計節點
- 跨業務基礎數據層統計節點
- 結果數據層統計節點
- 結果數據同步節點
2.1 劃分維度
舊版本的工做流,主要包含如下幾個維度:開發
2.1.1 源數據庫
2.1.2 產品線
- 源數據屬於哪一個產品線
- 包括:源數據同步節點 + 單業務基礎數據層統計節點
2.1.3 目標系統
- 結果數據是給哪一個系統提供的(後臺系統、BI、DataV、……)
- 包括:結果數據層統計節點 + 結果數據同步節點
2.1.4 業務模塊
- 結果數據屬於哪一個業務模塊(訂單+投訴、訂單+保險、商家+訂單、……)
- 包括:跨業務基礎數據層統計節點 + 結果數據層統計節點 + 結果數據同步節點
2.1.5 運行週期
2.1.6 輸入/統計/輸出
- 包含的節點的類型,是屬於「源數據遷入」、「統計任務」仍是「結果數據遷出」
- 包括:全部節點
2.2 其餘劃分原則
- 儘可能減小每一個工做流所依賴的上游工做流的個數;
- 能用一句話給整個工做流起個名字;
- 每一個工做流內的節點數量不超過30個;
3. 舊版工做流與新版業務流程的區別
3.1 運行週期
- 舊版工做流:
整個工做流(包含多個內部節點),對應一個運行週期
- 新版業務流程:
每一個節點,對應一個運行週期
3.2 依賴關係
舊版工做流:同步
- 工做流依賴工做流;
- 內部節點依賴內部節點;
新版業務流程:工作流
- 業務流程之間,無依賴關係;
- 節點依賴節點,能夠跨業務流程依賴,能夠不一樣運行週期的任務間依賴。
3.3 節點的分類
- 舊版工做流:
無分類,只能經過內部節點的命名來區分
- 新版業務流程:
能夠自動按節點類型分類(SQL節點、數據同步節點、機器學習節點、……)
3.4 工做流(業務流程)的分類
- 舊版工做流:
無分類,只能經過工做流的命名來區分
- 新版業務流程:
能夠經過「解決方案」功能來分類(相似於給每一個業務流程打標籤),「業務流程」與「解決方案」是「多對多」的關係。
3.5 提交範圍
- 舊版工做流:
整個工做流(包含多個內部節點)一塊兒提交
- 新版業務流程:
單個任務節點提交。也支持業務流程中多個節點批量提交的方式。
3.6 重命名
舊版工做流:產品
- 工做流不支持重命名;
- 內部節點不支持重命名;
新版業務流程:後臺
- 業務流程支持重命名;
- 節點支持重命名;
3.7 添加文件夾的位置
- 舊版工做流:
多級文件夾→工做流→內部節點
- 新版業務流程:
業務流程→數據集成/數據開發→多級文件夾→節點
4. 業務流程劃分原則
最後,關於個人業務流程的劃分原則,總結以下:基礎
- 業務流程是完成一個最小業務的;
- 業務流程的數量能夠稍微多一點兒,能夠經過解決方案去查找;
- 每一個業務流程裏的節點最好不要太多,每一個業務流程裏能直觀展現的就只有那麼多;
但願你們也能早日用上DataWorks2.0的諸多給力功能!不用繼續在舊版工做流中縫縫補補。統計