市面上的BI工具形形色色,功能性能包裝得十分亮麗,但實際應用中咱們每每更關注的是樸實的技術特性和解決方案。對於大數據,將來的應用趨勢不可抵擋,不少企業也正存在大數據分析處理展示的需求,如下咱們列舉市面上主流的三款BI系統,就「大數據」特性展開探討,主要是與Hadoop、Spark、多維分析數據庫的對接和性能。
Tableau的大數據策略
一、目前,Tableau適用的大數據生態系統鏈接包括:
Hadoop:Cloudera Impala 和 Hive、Hortonworks Hive、MapR Hive、支持 Impala 和 Hive 的Amazon EMR、Pivotal HAWQ、IBM BigInsights
NoSQL:MarkLogic、Datastax
Spark:Apache Spark SQL
多維分析數據庫: Teradata Aster、HP Vertica、SAP Hana、SAP Sybase、Pivotal Greenplum前端
二、Tableau 可實時鏈接到數據源,或將其調入內存。在快速交互式查詢分析時,實時鏈接做用很大。但因爲內存式分析,對硬件要求較高,數據量較大時效率會比較低。
三、面向業務用戶的大數據自助式可視化。業務用戶可以使用拖放操做可視化其數據,而無需編寫複雜的SQL、Java代碼或 MapReduce做業。Tableau簡化了分析數據的任務,用戶可比之前更快地從數據中發現形象可見的看法。
FineBI的雙套大數據方案
一、FineBI支持的大數據生態系統鏈接包括
大數據平臺:Vertica、GreenPlum、Apache Kylin、Impala/hive、hive、星環,
NO SQL數據庫:MongoDB
多維分析數據庫:Teradata、SAP Hana、Greenplum、SAP Sybase、Essbase、SSAS
二、FineBI支持FineIndex和FineDirect兩種數據鏈接和處理模式,應對的是不一樣的數據方案。
FineDirect應對的是一些須要實施展示結果,好比銀行交易風險的流水分析,直接對接hadoop,kylin,greenplum等大數據平臺。
FineIndex採用cube連,也就是說數據庫-FineIndex-前端分析,FineIndex至關於一箇中間庫的形式,用來存儲數據表,關聯轉義索引等。這些都對後續前臺分析處理數據效率有很大的提高(由於直接sql取數,效率受數據庫自己的限制,數據量大時,通常分析工具很容易就卡死升職內存溢出致使系統無響應)
三、用於執行跨數據源分析的數據混合。FineBI能夠將大數據和其餘數據源(如MySQL、Excel 文件等)混合,讓用戶可以跨越各類數據源存取數據,並整合到一個庫內(FineIndex)。sql
Qlikview
一、Qlikview也是基於內存的BI,能實時響應用戶的分析需求,與Tableau類似,性能大多決定於數據庫。能直接從用戶的業務系統中採集數據並進行多維分析,剔除了傳統BI基於數據倉庫(集市)才能實施的弊病。(做者從網上和其資料庫中並無查到太多關於大數據方面的闡述,官方也並無這方面的能夠宣傳)。
二、QlikView的核心是一個得到專利的AQL構架。在分析時不須要傳統OLAP立方體,也不必定要使用數據庫,徹底利用了基礎硬件平臺,來對上億的數據進行業務分析。QlikView應用使各類各樣的終端用戶以一個高度可視化,功能強大和創造性的方式,互動分析重要業務信息。數據庫