摘要: 2019年1月18日,由阿里巴巴MaxCompute開發者社區和阿里雲棲社區聯合主辦的「阿里雲棲開發者沙龍大數據技術專場」走近北京聯合大學,本次技術沙龍上,人人車大數據平臺負責人吳水永從人人車數據平臺的總體架構、如何基於阿里雲打造一個輕盈的數據平臺以及人人車企業基於阿里雲技術開發的BI數據報表平臺等三個方面進行了精彩分享。數據庫
如下內容根據演講視頻以及PPT整理而成。安全
快速搭建,一年時間完成6大平臺的搭建微信
基於阿里雲平臺上成熟的技術,人人車企業只用了一年時間便實現了6大數據平臺的設計與搭建,其中包括:Jarvis-BI報表平臺、Metadata-元數據管理平臺、Streaming-實時計算平臺、Athena-數據工單平臺、Cateye-監控平臺與AD-HOC-自助取數平臺。架構
上述數據平臺的最底層均由阿里雲的相關技術支撐運行,阿里云爲平臺的搭建提供了兩種不一樣技術的支持,在儲存計算技術方面,阿里雲提供了 RDS雲數據庫、MaxCompute大數據計算平臺、OSS對象儲存等儲蓄技術。在雲通訊技術方面,阿里雲一樣提供了SLB、DTS、DataX、CDN等雲通道技術。併發
企業遵循阿里雲 「One Data,One Server,One Meta」理念進行平臺的設計與實現。「One Data」這裏表示統一的數據源,企業將全部數據出口彙總到MaxCompute並在Hadoop集羣上搭建統一的數據源。圍繞統一的數據源,企業搭建了許多相關業務的搜索引擎,包括:Spark、Clickhouse、Presto、Druid.io等。在搜索引擎的基礎上,平臺基於「One Server」的設計思想封裝了統一的DataServer爲這些搜索引擎提供上層數據服務。「One Meta」表明統一的元數據,元數據至關於數據流中的骨架,企業設計並實現的元數據管理平臺很好地完成了對元數據的管理任務,經過元數據企業能夠更好的管理數據權限及各類數據指標。人人車企業基於阿里雲的技術與思想打造的數據平臺輕盈可靠,爲企業帶來了很高的效益。高併發
以下圖所示,在阿里雲技術的基礎上,人人車數據平臺的數據流實現分爲如下4層:工具
基於數據驅動理念及市場的需求,人人車企業基於阿里雲成熟的MaxCompute技術嘗試設計搭建了企業本身的數據倉庫。在阿里雲便捷的方案與穩定技術的支持下,企業的數據倉庫搭建順利成功,目前已開始爲公司貢獻數據上的效益。oop
1. 數據倉庫能夠解決什麼問題?性能
創建數據倉庫能夠爲整個工程提供一個良好的數據體系,解決異構數據源工程開發中的口徑版本不1、效率低下、缺少可信度等問題。數據平臺的開發是由良好的頂層設計來決定底層建築的過程,優秀的數據平臺設計方案在實現過程當中會爲開發團隊節省大量的人力與時間。搭建一個標準的數據倉庫,便是完成數據平臺頂層設計的第一步。大數據
2.數據倉庫的標準
企業業務上經常使用的數據倉庫爲三段式模型,目前最爲流行的是基於主題內容的Inmon模型與基於維度的Kimball模型。這兩種建模的目標都是創建一個更高效、穩定、靈活的數據倉庫模型。企業能夠從耦合度、性能與成本、效率與質量這三大維度選擇合適本身業務的數據倉庫模型。在數據倉庫搭建的實施過程當中,人人車平臺選擇在阿里雲的MaxCompute服務基礎上進行企業數據倉庫的搭建。以下圖所示,經過阿里雲MaxCompute服務搭建的數據倉庫從如下五大方面爲人人車的數據倉庫搭建帶來了便利:
3.平臺數據倉庫結構
以下圖所示,人人車平臺數據倉庫的結構分爲如下幾層:
4.基於MaxCompute搭建的數據倉庫效果
以下圖所示,是人人車平臺基於阿里雲MaxCompute搭建的數據倉庫的運行數據。經過阿里雲的MaxCompute,人人車平臺實現了快速高效搭建數據倉庫的願景。平臺所搭建的數據倉庫安全可靠,運行平穩,而且在每日數據峯值階段的表現優異。同時,經過使用阿里雲的服務搭建數據倉庫,企業節省了不少沒必要要的開銷。
5.數據同步問題
在數據倉庫的實現過程當中,數據同步是一大難題。阿里雲提供了一些便捷的標準接口幫助企業更方便地將數據同步到MySQL之外的設備上。企業能夠對這些標準化的接口進行個性化的定義,以此方便自身業務的開發與編寫。
6.數據倉庫最佳實踐
在數據倉庫的設計與實踐過程當中,人人車平臺總結了如下一些經驗:
人人車企業以阿里雲技術爲基礎設計並實踐的另外一大成果是BI數據報表平臺,經過BI數據報表平臺,企業完成了對市場數據的輕鬆掌控,並大大提升了自身決策的準確度。
1. 方案的選擇--論POC以及TPC的重要性
在BI報表平臺實現的方案中,人人車採用了POC模式與TPC模型來實現。
POC模式意爲產品原型驗證模式,開發者在產品原型驗證模式下須要去了解客戶的基礎需求,經過理解用戶的需求爲用戶搭建一個業務原型場景。
TPC-DS模型是設計數據庫經常會用到的模型,其中包括:關係模型、星型模型及雪花模型,其優秀的工做負載能力能夠爲系統帶來很高的穩定性。
2.ClickHouse數據管理系統
ClickHouse數據庫管理系統開發自俄羅斯,系統擁有以下優勢:
3.BI數據報表平臺架構
以下圖所示爲BI數據報表平臺的架構示意圖,平臺的架構能夠分爲如下幾大部分:
下圖爲系統使用時的效果圖。在編輯圖表的過程當中,使用者能夠按照本身所想自由的拖拽拉動數據圖表,實現數據圖表的簡單化操做。基於大數據統計出的表格會將數據的特色直觀地表現給用戶,大大方便了用戶的使用。
下圖所示爲BI數據報表平臺在移動端的效果圖。
4.BI數據報表平臺的優點
BI數據報表平臺除了其方便操做的特色外,還爲使用者帶來了如下優點技術:
在上述架構與優點技術的支持下,BI數據報表平臺具有下列特色:
5.BI數據報表平臺搭建時的經驗
在BI數據平臺的設計與搭建中,人人車平臺也摸索總結了不少經驗:
6.BI數據報表平臺的數據驅動
BI平臺使用了數據驅動的運營方式,僅對用戶最感興趣的幾個指標項進行考覈,將考覈獲得的結果與業績直接掛鉤,實現用戶在掌上查看相關數據,大大方便用戶的工做與生活。
原文連接 更多技術乾貨 請關注阿里云云棲社區微信號 :yunqiinsight