BI和數據倉庫:企業分析決策真的離不開數據倉庫嗎?

圖片描述

很長一段時間,BI和數據倉庫幾乎都是如影隨形、難捨難分。企業若是想要實行「數據驅動決策-決策推進業務發展」的機制,就必須先有數據倉庫充當中央存儲庫,供BI查詢和調取,而後再在BI上進行數據的分析與可視化。網絡

但數據分析和商業決策發展至今,企業想要實現數據驅動決策,是否仍是沒法繞過數據倉庫?在現代商業環境中從新定義BI和數據倉庫,咱們又能不能找到合適的替代方案?架構

今天,咱們就這個命題展開討論,但願能給你們提供一些思路。分佈式

數倉:BI背後的引擎(或管道)

數據倉庫:從字面意義上即數據的倉庫,是爲了把操做型數據集成到統一的環境中,以提供決策型數據訪問。數據倉庫關注的是解決數據一致性,可信性,集合性.......這些問題,把愈來愈複雜的業務數據轉化成對於業務運營、業務分析來講簡單易用的數據形式;數據倉庫的終極目標是讓數據應用人員(不管是CEO仍是普通分析師)思考怎麼使用數據倉庫裏的這些數據,創造更多的信息與價值;而不是發愁數據在哪裏,數據對不對。工具

BI(商業智能):BI是分析數據並獲取洞察力、從而幫助企業作出決策的一系列方法、技術和軟件。相比數據倉庫,BI中還包含了數據挖掘,數據可視化,多維分析,標籤分類等方面。拿多維分析舉個例子,數據倉庫中只是提供了維度化的數據,可是基於某些工具,好比Ebay的kylen或者IBM的Cognos等,能夠支持用戶在必定範圍內任意組合維度與指標,那這就上升到了決策支持的層面而不是「高級數據倉儲」層面了,也就是使用了數據倉庫的數據,但不是數據倉庫的功能。ui

圖片描述

BI與數據倉庫的相關性(圖片來源於網絡)spa

傳統BI項目的構建路徑決定了其必須依賴數據倉庫才能進行數據分析。好比MicroStrategy,SAP BW,微軟 Analysis Server, IBM的Cognos,Oracle的OBIEE,這些傳統BI工具不具有使數據集成標準化的能力,數據倉庫的存在就是幫助他們創建數據治理結構,解決數據冗餘、不一致、錯誤、沒法輕鬆訪問等問題。blog

另外一方面,BI對數據倉庫的這種依賴其實存在着極大的缺陷。通常來講,數據倉庫一般須要花費高經濟成本、時間成本從規劃到落地,但創造的價值大多數狀況比較有限,ROI較低。搭建成功後,數據倉庫也僅支持極少數特定類型的分析,若是企業業務出現調整或者須要處理新類型的數據,屆時又將從新面臨重大的開發工做。圖片

從現代商業決策視角,從新審視BI與數據倉庫的關係

在現在轉向服務導向架構(SOA)(*由Gartner提出,以「服務」爲基本元素來組建企業IT架構的方式。SOA要解決的主要問題是:快速構建與應用集成,現已成爲解決企業業務發展需求與企業IT支持能力之間矛盾的最佳方案。)的技術大背景中,耗費巨大心力進行大規模的數據整合和數據集成操做是否還有必要?構建數倉的收益是否能大於你將付出的成本?開發

再加上企業數據體量不斷提高,業務發展愈來愈迅速,對快速印證分析決策也提出了更高要求,更多的企業但願可以下降技術設施成本,作到近乎實時地訪問操做源數據,在極短的時間內響應用戶請求。數據分析

圖片描述
數據倉庫和BI的體系結構(圖片來源於網絡)

因而咱們看到了愈來愈多沒有數倉的BI項目。一方面,敏捷BI的興起,容許用戶快速接入各種數據源,無需藉助數倉便可實現數據導入-處理-分析的流程。而另外一方面,以觀遠數據爲表明的新一代AI+BI智能數據分析平臺,則在快速接入、敏捷分析的基礎上,實現了更進一步的應用:

觀遠數據智能分析平臺:

  1. 自帶輕量的分佈式數據存儲與數據流處理模塊,提供從數據抽取、數據建模、數據分析,到數據可視化、預警分發的一站式數據分析應用能力;
  2. 即使不抽取數據,也可實現多數據源的聯邦動態分析(聯動、鑽取、動態參數等交互分析功能)。

在這個角度上來看,必定程度上能夠在沒有數據倉庫的前提下實現智能數據分析,可是,這僅限於數據量有限的中小型企業,不意味着咱們推薦直接拿數據分析平臺上的數據存儲當作數據倉庫來用。

由於隨着企業用戶數據量、分析複雜度的不斷提高,數據分析平臺上輕量式數據存儲與數據流處理模塊是難以承受巨大的計算壓力的,從企業長遠發展的角度上考量,仍是須要有計劃地建設數據倉庫或數據平臺。

企業構建分析決策架構的敏捷策略

企業分析決策架構的將來前景,取決於業務驅動因素以及技術的發展方向。現在企業數據呈指數級增加,對實時分析的需求比以往任什麼時候候都要強烈,鑑於此,如何兼顧快速落地與高可擴展性,有機結合數據倉庫來構建企業分析決策架構,還是擺在衆多企業面前的一個巨大難題。

對此,觀遠數據推薦的最佳實踐是:

  1. 在數倉還沒有搭建或分析思路還沒有成型時,直接在BI平臺內快速構建分析應用,快速反饋、快速迭代,實現quick win。
  2. 在分析結果獲得業務的印證後,再將數據沉澱和複雜分析邏輯逐步固化到數據倉庫或數據平臺裏面實施,此時BI平臺僅擔負輕量的數據分析與可視化壓力。

咱們認爲,數據分析的本質是爲業務發展、商業決策而服務,而不是建立一堆無用的可視化圖表。經過以上提到的這種敏捷開發,快速印證,不斷沉澱的過程,將可以更大程度上確保企業分析決策架構的方向正確,得到業務端的認同,驅動業務發展,從而產生真正的商業價值。

相關文章
相關標籤/搜索