80/20法則是計算機領域常常見到的現象,好比一個軟件80%的時間只是在運行其中20%的代碼,或者計算機芯片CPU只有20%的時間在作計算,其餘80%的時間在休眠或者等待其餘操做。微信
在數據分析特別是商務智能(BI - Business Intelligence)中一樣存在相似的狀況。在企業中,經常須要根據積累的數據來制定商業決策,最經常使用的方式是製做各類報表爲企業管理人員提供決策支持。這裏的80/20現象就是人們發現80%的時間花費在報表系統的開發構建上,而真正使用報表的時間只有20%。或者總的來講,80%的報表只有20%的人看。工具
一般的流程是:spa
管理層提出初步報表需求 -> 開發部門實現報表
-> 管理層提供反饋或者須要加入新數據 -> 開發部門完善報表
-> 管理層獲得最終版本的報表進行商業決策code
一般一個流程須要一至兩個星期的時間,耗費的開發成本和時間成本比較高,有時候開發時間過長甚至會對商業上的決策形成拖延。開發
解決這個問題的辦法就是打破80/20法則,甚至顛倒其中的比例,好比將開發報表的時間縮減至20%,進而讓80%的時間花費在使用報表上。這也是進幾年流行的自服務數據報表系統(Self-Service BI)。數據分析
要達到這個目標,有一些技術挑戰:構建工具
方便易用的數據可視化工具class
強大靈活的數據模型構建工具數據可視化
集中管理的企業虛擬化數據倉庫基礎
解決以上技術挑戰以後,整個企業的數據能夠物理上存放在不一樣的地方,可是有一個統一的訪問路徑,開發人員定義好數據模型以後,企業管理人員或者非技術人員可使用傻瓜式的數據可視化工具,本身選取想要查看的數據,進行數據分析。新的報表流程簡化爲:
管理層提出報表數據需求 -> 開發部門創建數據模型 -> 管理層本身查看數據
完成這個改造後的流程以後,當有新的報表需求,開發人員所須要的工做僅是建立和維護數據模型,從企業角度,報表開發時間下降到20%,而80%的時間是用戶在使用報表系統。
因爲篇幅所限,這裏就不展開對這些技術的具體闡述了。有興趣者能夠聯繫做者進一步交流(boyang798@gmail.com)。
如今國內有些公司已經開始在這個領域作了紮實的基礎工做,好比數據可視化工具已經比較成熟,數據倉庫也有公司在作底層數據平臺,在數據模型構建工具方面,目前還不是很成熟,但願將來有更多的公司進入這個領域,提供成熟的解決方案。
掃描微信二維碼聯繫做者