編者按:本文轉載自網易副總裁,網易杭州研究院執行院長汪源的我的公衆號「冷技術熱思考」(歡迎搜索關注)。上一篇中臺系列的文章重點闡述了中臺的概念,本文是系列文章的第二篇,目的是說明什麼狀況下能夠考慮建設中臺,若是要建怎麼建的問題,能夠做爲企業思考中臺建設的大框架。如下爲原文(有少許改動):本文將例舉典型的須要建設中臺的場景,供參考判斷要不要建中臺。建設中臺須要考慮組織、技術支撐和方法論,每每還須要諮詢服務的幫助,本文也能夠做爲思考中臺建設的大框架。前端
並非數據量大就須要建中臺,主要仍是看用數據的姿式是否是比較複雜,當前問題是否是比較多。對於這類符合的業務,數據中臺能把層層數據直到最上層的指標梳理清楚,提高數據質量,從而提高運營效率。把數據理清楚了,每每還能下降數據存儲和數據開發人員的成本。數據庫
除了上述判斷,還有一條是同行對比。若是一個行業你們都有點躍躍欲試想弄中臺,那領先者必定要想辦法搶先(既然是領先者了,每每也符合上述標準),否則就可能被顛覆。跟隨者要不要想辦法搶先從而超越領先者呢?可能很差說吧,但若是領先者已經建了,跟隨者通常得緊跟,不然真可能被甩開了。編程
若是根據上述邏輯以爲大體要考慮去搞一把中臺的話,那請繼續讀本文如下內容,讀完本文後續內容而後更具體的看看問題存不存在,條件是否具有。要建設中臺,須要考慮組織、支撐技術、方法論這三個方面,每每還須要諮詢服務。後端
中臺組織關鍵要懂業務和承擔業務職責。舉個例子,一個大數據平臺的建設運維團隊不是一箇中臺組織。一個團隊若是作了很是完善的中臺產品(如開發了數據中臺所須要的指標管理系統、數據倉庫開發系統、數據質量管理系統等等),但只是把產品提供給業務方使用,這個團隊仍然不能說是中臺組織。只有當這個團隊承擔起指標體系的建設和管理、數據倉庫的設計和實施、數據質量的保障等工做時,才能夠說是中臺組織。而要作到這一點,這個組織確定是比較瞭解業務的,它的目標和考覈也必定與業務有相關性(確定不僅是平臺穩定性這樣的非業務指標)。安全
中臺組織的層次與中臺的層次最好是對應的,BU級的中臺組織最好直接向BU老大或分管的CXO彙報,企業的中臺組織最好直接向CEO或分管的CXO彙報。架構
這裏特別說明一點的是若是不建設在線業務中臺,而只是採用微服務、雲原生等技術的話,能夠不涉及組織方面的大規模變更,就在原來的研發部實現轉型。一般來講也能夠實現必定的系統可用率、彈性和研發效率方面的提高。併發
同時,數據中臺還須要強大的大數據計算引擎、數據集成 / 同步 / 交換引擎,還每每須要一套敏捷BI系統:· 大數據計算引擎:數據中臺要管理的數據規模和複雜度每每都很高(不然搞中臺屬於爲賦新詞強說愁),因此傳統的數據庫和數據倉庫基本上支撐不了。當前的技術環境下,基於Hadoop MapReduce或Spark幾乎是惟二的選擇,固然這也包括了這二者之上的Hive和Spark SQL。能用SQL就用SQL,易於維護,也易於數據血緣的收集。除此以外,流處理可能還須要Flink,交互式查詢可能要引入Impala或GreenPlum。· 數據集成 / 同步 / 交換引擎:一方面數據中臺須要強大的數據集成和同步能力才能吸納各方數據。集成和同步的概念相近,同步更強調實時性。另外一方面,數據中臺每每由多種數據計算引擎構成,就須要同步或交換引擎實現不一樣引擎見的數據交換。· 敏捷BI系統:建設數據中臺一般最重要的目的是爲了支持業務運營和決策,爲此須要基於數據中臺進一步開發數據產品。敏捷BI系統是開發數據產品快速、輕型的手段,可以儘快儘早的發揮數據中臺的價值。框架
此外,對於互聯網業務,統一的埋點引擎每每也是數據中臺所須要的。若是埋點的邏輯都不統一的話,建數據中臺的時候會發現數據的源頭就是亂的,後續也都無法作。其餘行業業務,數據採集也屬於基礎工做,也是要先作好的。less
因而可知,建設數據中臺須要的技術支撐體系也是至關的龐大,複雜。所幸的是這十年來Google等領先的企業、Hadoop / Spark等開源社區以及大量的廠商大體聯合探索出了一條可行的路徑,方法論和技術路線都比較統一了。以此爲基礎,就能夠提供較成熟的數據中臺技術支撐產品,如網易杭研研發的「網易猛獁V6.0 + 網易有數」就是一套較完整的數據中臺產品。運維
點擊連接更多關於網易數據中臺