通過幾年的積累,大部分中大型的企事業單位已經創建了比較完善的
CRM、ERP、OA等
基礎信息化系統。這些系統的統一特色都是:
經過業務人員或者用戶的操做,
最終對數據庫進行增長、修改、刪除等操做。上述系統可統一稱爲
OLTP(
Online Transaction Process,在線事務處理),指的就是系統運行了一段時間之後,必然幫助企事業單位收集大量的歷史數據。可是,在數據庫中
分散、獨立存在的大量數據對於業務人員來講,只是一些沒法看懂的天書。
業務人員所須要的是信息,是他們可以看懂、理解並從中受益的
抽象信息。此時,如何把數據轉化爲信息,
使得業務人員(包括管理者)可以充分掌握、利用這些信息,而且輔助決策,就是商業智能主要解決的問題。 如何把數據庫中存在的數據轉變爲業務人員須要的信息?大部分的答案是
報表系統。簡單說,報表系統已經能夠稱做是BI了,它是BI的低端實現。
國外的企業,大部分已經進入了
中端BI,叫作
數據分析。有一些企業已經開始進入
高端BI,叫作
數據挖掘。而
我國的企業,大部分還停留在報表階段。
數據報表不可取代
傳統的報表系統技術上已經至關成熟,你們熟悉的
Excel、水晶報表、Reporting Service等都已經被普遍使用。可是,隨着數據的增多,需求的提升,傳統報表系統面臨的挑戰也愈來愈多。
1.
數據太多,信息太少
密密麻麻的表格堆砌了大量數據,到底有多少業務人員仔細看每個數據?到底這些數據表明了什麼信息、什麼趨勢?級別越高的領導,越須要簡明的信息。若是我是董事長,我可能只須要一句話:咱們的狀況是好、中仍是差?
2.
難以交互分析、瞭解各類組合
定製好的報表過於死板。例如,咱們能夠在一張表中列出不一樣地區、不一樣產品的銷量,另外一張表中列出不一樣地區、不一樣年齡段顧客的銷量。可是,這兩張表沒法回答諸如「華北地區中青年顧客購買數碼相機類型產品的狀況」等問題。業務問題常常須要多個角度的交互分析。
3.
難以挖掘出潛在的規則
報表系統列出的每每是表面上的數據信息,可是海量數據深處潛在含有哪些規則呢?什麼客戶對咱們價值最大,產品之間相互關聯的程度如何越是深層的規則,對於決策支持的價值越大,可是,也越難挖掘出來。
4.
難以追溯歷史,數據造成孤島
業務系統不少,數據存在於不一樣地方。太舊的數據每每被業務系統備份出去,致使宏觀分析、長期歷史分析難度很大。
所以,隨着時代的發展,傳統報表系統已經不能知足日益增加的業務需求了,企業期待着新的技術。數據分析和數據挖掘的時代正在來臨。值得注意的是,數據分析和數據挖掘系統的目的是帶給咱們更多的
決策支持價值,並非取代數據報表。報表系統依然有其不可取代的優點,而且將會長期與數據分析、挖掘系統一塊兒並存下去。
基本介紹
商業智能套件SpagoBI提供一個
基於J2EE的框架用於管理BI對象如
報表、OLAP分析、儀表盤、記分卡以及數據挖掘模型等。它提供的BI
管理器可以控制、校驗、驗證與分發這些BI對象。SpagoBI特性包括支持
Portal、Report、OLAP、QbE(FreeInquiry)、ETL、Dashboard、文檔管理、元數據管理、數據挖掘與地理信息分析等。SpagoBI的安裝配置較爲簡單方便,可以方便地在UNIX/Linux、WindowsServer操做系統下,基於流行
Tomcat7.0.xServer和JDK1.7.x環境運行,實現了
Web框架下的AJAX風格的UI顯示界面,比較適合於
中、小型的應用軟件系統進行智能化分析類OLAP、Ad-hoc、Reporting等BI相關應用展現。其典型demo顯示截圖以下:
SpagoBI平臺功能較爲完整,官方聲稱市場上惟一100%開源的BI套件解決方案(基於LGPL協議);各個BI組件之間模塊化很好,經過Plugin插件方式加載,來看一下它的各個組件:
Report:BirtReportDriver,BirtReportEngine,JasperReportDriver,JasperReportEngine
GEO:GeoDriver,GeoEngine(用地圖顯示數據和查詢的)
OLAP:JPivotDriver,JPivotEngine
QBE:QbeDriver,QbeEngine
DataMining:WekaDriver,WekaEngineSecurity:ExoPortalSecurityProvider
ETL:Octupus和talend(Talend是官方合做夥伴)
Portal:eXoPortal
Booklet(小冊子):BookletsComponent:主要包括文件上傳,工做流,OpenOffice支持。
它還支持文檔管理,用的是Apache的JackRabbit;支持搜索功能,使用的是ApacheLucene。它的展示層也使用了AJAX特性,另外它在DashBoard也使用了Openlaszlo,(一個用Javacode生成Flash的框架),因此SpagoBI的DashBoard看上去很好。SpagoBI體系架構圖以下
它的界面強大、美觀,具有良好的跨瀏覽器支持,頁面縮放,元素的佈局都很穩定劃一。
軟件下載
截止到2015年4月,SpagoBI軟件的最新版本號爲v5.1 。
一、下載完整的包含全部插件的安裝All-In-One-SpagoBI-5.1-21012015.zip。
二、下載SpagoBI元數據庫配置表須要的SQL腳本(SpagoBI支持Oracle/MySQL/SQLServer/Ingres/Postgres-SQL等多種RDBMS關係型數據庫)
三、修改SpagoBI內置的Tomcat7.xServer對應的server.xml配置,建立metadata元數據庫,並啓動相關實例SpagoBI應用是以核心加引擎的模型來組織應用的。SpagoBI發行包中包含多個引擎。
軟件配置
本文及之後的示例使用的
數據庫都爲oracle,如需使用其餘數據庫請從SpagoBI官網下載相應數據庫的BDSQL腳本文件並運行
1.首先在Oracle實例中
建立數據庫SpagoBI。
2.建立數據庫完成後
建立表空間等:
--在建立用戶以前,先要建立表空間:
SQL>createtablespaceSpagoBIdatafile'/data/oradata/SpagoBI.dbf'size500M;
--建立用戶
SQL>createuserSpagoBIidentifiedbySpagoBIdefaulttablespaceSpagoBI;
--授予權限
SQL>grantconnect,resourcetoSpagoBI;
3.建立數據表,執行ORA_create.sql
4.建立定時器數據表,執行03ORA_create_quartz_schema.sql
5.以上操做完成後能夠進行部署環境,更改tomcat_home\conf\server.xml中的<Resourcename="jdbc/SpagoBI"auth="Container"type="javax.sql.DataSource"driverClassName="oracle.jdbc.driver.OracleDriver"url="jdbc:oracle:thin:@127.0.0.1:1521:SpagoBIi"username="SpagoBI"password="SpagoBI"maxActive="20"maxIdle="10"maxWait="-1"/>數據庫鏈接部分。
l修改.\webapps\SpagoBI\WEB-INF\classes\下hibernate.cfg.xml,
l修改:jbpm.hibernate.cfg.xml數據庫方言設置hibernate.dialectorg.hibernate.dialect.Oracle9Dialect修改quartz.propertiesorg.quartz.jobStore.driverDelegateClass=org.quartz.impl.jdbcjobstore.oracle.OracleDelegate
l修改默認服務器URL與端口號:SpagoBI默認端口是8080,若是想使用其餘端口須要在Tomcat配置文件server.xml中將默認端口修改,同時修改SpagoBI_service_url和SpagoBI_host_url中默認端口。SpagoBIServer部署在內網環境的服務器上時,須要修改Tomcat配置文件中的URL的localhost爲IP地址(例如192.169.2.x),若是在公網上部署,可使用DNS域名。
6.運行Tomcat,啓動SpagoBI(點擊bin下SpagoBIStartup.bat文件)。在啓動的過程當中SpagoBI會在後臺將一些必須的數據保存到數據庫中。