由於要加入一個BI項目,因此最近在研究BI相關的知識體系,因爲這個方面的知識都是比較零散,開始都不少概念,不知道從何入手,網上找的資料也很少,特別是實戰案例方面更少,這裏仍是先把理論知識理解下吧,分享給你們,一塊兒學習。下次再把實戰的一一分享出來。
1、什麼是商業智能BI前端
BI(Business Intelligence)即商業智能,它是一套完整的解決方案,把企業的運營數據轉化爲信息或知識,輔助企業作出明智的業務經營決策的工具。將無序、零散、孤立的數據轉換成整合的、規律的、有價值的數據資產,將其以直觀、形象的方式展示給合適的人。使得企業用戶可以利用商業智能系統進行有效的分析、報告、監控,數據資產獲得利用。數據庫
強調:在恰當的時間經過恰當的手段把恰當的信息傳遞給恰當的人。編程
擴展詮釋,包括以下幾點:架構
一、是技術:BI是一系列技術的合集,包括ETL技術、數據倉庫技術、OLAP技術、數據挖掘技術等。這些技術基礎,是咱們實現整個系統的基石,它們也衍生了咱們形形色色的各類技術崗位分工。工具
二、是工具:BI是與工具相關的,咱們須要藉助各類工具,來實現建設目標,這些工具包括ETL工具:SSIS、Datastage、Kettle;OLAP工具:SSAS、Hyperion Essbase;前端展示工具:Cognos、BIEE等等。性能
三、是努力過程:BI是一個努力的過程,這個過程,是企業將數據資產利用起來,發揮數據的價值的一個過程;是企業從高管相當鍵用戶至普通用戶及IT,和諮詢、實施方多種角色協力推動的一個過程。這個過程當中通常分爲需求階段、設計階段、開發階段等等階段。學習
四、是講方法:在BI的過程當中,是講求方法的,咱們用一整套最佳實踐的方法貫穿全過程,來確保系統的成功落地。操作系統
五、是要結果:結果能夠是報表、分析、儀表盤等等一系列的應用交付。架構設計
六、最終目的:用盡方法,一切爲了輔助企業更好、更及時、更準確的作出決策。設計
2、業務系統與商業智能系統的區別
這兩種系統,有不少種角度能夠進行闡述。在這裏,我列舉幾個方面進行說明:
一、從數據資產利用角度,企業運行ERP以後,將積累大量的數據資產,數據資產要加以利用,就必須以另一種系統形態來發揮數據價值,就須要商業智能系統來達成這一目的。
二、從系統集成角色,企業建設若干系統以後,須要打破信息孤島情況,實現統一的數據資源平臺,便須要對各個系統進行數據集成。
三、從分工及性能角度來講,隨着企業業務數據量的增大,基於事務處理的系統結構,沒法支撐數據統計分析類型的需求,E.F.CODD在1993年便提出OLAP概念,區別於OLTP事務處理系統,即是一個例證。
四、從面向對象角度來講,業務系統以業務處理爲主,企業的中高層用戶未必適合使用,定位於面向企業從上至下各層次角色的BI系統,重點面向中高層,從而必定程度上較好的解決他們的管理需求。
因此,商業智能系統又一種說法是信息化最後一千米。
3、初學者如何學習BI
主要是偏向技術路線:
一、基礎-SQL:掌握基礎技能-SQL,作BI相關工做,能夠不熟悉編程,可是SQL技能缺失,就至關吃虧。
二、技術選擇:在BI技術上作出選擇,BI技術分類不少,結合本身的工做、本身的性格、本身的喜愛、肯定一個主攻方向。好比:前端應用開發;有精力的話,能夠再加上一個鋪攻方向,好比ETL。
三、工具選擇:同一個技術類的工具,選擇兩款或以上,進行對比,瞭解其共性功能和個性特色,加深認識。好比:學習前端工具,能夠選擇Cognos和BIEE;學習ETL工具,能夠選擇SSIS和Datastage。
四、基礎概念和技術:深刻理解基礎概念,好比:維度、度量、星形模型、雪花模型、OLAP、旋轉、切片、鑽取等術語。在這基礎上,掌握一些關鍵技術,好比緩慢變化維、增量數據處理等。
五、行業業務知識:關注行業業務知識,業務是BI的魂。學習和工做實踐中,儘可能抓住與甲方相關業務負責人、諮詢顧問、需求分析師交流的機會,儘量多掌握些業務方面的知識。在單純的技術期事後,升遷或換工做,極可能就會須要必定相關業務行業經驗。
六、項目管理知識:學習項目管理知識和商業智能項目實施方法論。瞭解需求調研過程是如何進行的,數據源調研和質量分析有些什麼具體任務,系統設計又分哪些階段步驟,需求變動又如何處理。這些能夠必定程度上提升項目實施成功率。
七、利用各類資源:尋找和使用各類資源進行學習,這些資源包括數據、聯機幫助文檔、論壇、社區、郵件組、專業人士博客、學習視頻等等。
八、專業認證:根據實際狀況適當依據本身所從事的技術分類或是工具,經過專業認證考試,也是能夠爲簡歷加分的。
九、語言水平:提高英語能力。
十、我的興趣:喜歡BI,深刻研究,收穫成就感。從事的工做是本身感興趣的方面,這對於作好一個事情,一份工做是至關有利的。
4、BI基礎-數據倉庫理論
介紹學習商業智能,常常會涉及到架構設計理論知識,這裏說下數據倉庫理論兩大流派:Ralph Kimball和Bill Inmon。
在國內,一般所說的數據倉庫的四個特性角度(面向主題、集成、相對穩定、反映歷史變化、用於支持決策)的定義即是Inmon提出的,他被稱爲數據倉庫之父。而實踐大師Kimball的工具箱系列著做,亦被奉爲是數據倉庫建設的經典書籍。
一、基礎理論:
Kimball支持數據倉庫總線結構,提倡維度建模,以星形模型或是雪花模型等方式構建維度數據倉庫。架構體系中,數據集市與維度數據倉庫是緊密結合的,數據集市是數據倉庫中一個邏輯上的主題域。各類前端工具將能夠直接訪問使用維度數據倉庫。
Inmon提倡以三範式構建集中式的企業數據倉庫(EDW),做爲整個系統核心;在其之上再建設若干面向主題的、遵循維度模型設計的數據集市;前端工具一般訪問數據集市,而不直接訪問EDW。
二、數據倉庫建設方式
Kimball建議從底向上。先建設知足部門級分析需求的若干數據集市,再經過總線架構將它們集成,造成一個「聯合數據倉庫」。
Inmon強調自頂向下。先未來自各個源業務系統數據集成至企業級的數據倉庫,再基於其搭建面向部門應用需求的數據集市。
三、如何選擇
Kimball方法對團隊技術水平要求不過高,更易於實現,從小型的主題域數據集市建設起,但在逐步建設過程當中,聯合維度數據倉庫的一致性較難控制,適用於戰術層級的規劃,或是有迫切的目標須要實現。
Inmon的方式,規範性較好,數據集成和數據一致性方面能獲得處理,適用於較爲大型的企業級、戰略級的規劃。但對團隊的要求較高,且實現週期較長、成本昂貴。
5、BI項目角色劃分
通常一個BI項目實施至少須要如下角色:
一、行業BI顧問(兼項目經理):熟悉客戶所在行業,能與用戶進行業務溝通並引導客戶發掘需求。有BI項目管理管理經驗。
二、UI設計開發:有比較豐富的BI工具界面開發經驗,能發現不合理的界面需求,並及時引導客戶修改。
三、數據庫開發:有ETL及數據倉庫開發經驗。
因此,BI須要數據庫技術和業務知識結合才能產生價值。
基於我的是一直從事IT技術相關的,因此就以數據開發的角色來深刻BI的學習。
6、BI須要的技術
一、數據庫:Oracle,DB2,SQLSERVER,Sybase,MySQL;包括:SQL,PLSQL,備份,恢復,調優;
二、ETL: kettle, Informatica, Datastage, 手工ETL;
三、報表:Cognos, BO, BIEE, Hyperion, superset, metabase等;
四、操做系統, UNIX或者Linux,AIX, Solaris之類,SHELL腳本;
五、熟悉瞭解一些ERP系統,SAP,Sieble;
六、熟悉瞭解一些BI軟件:PowerBI、Wyn Enterprise、FineBI等。