背景介紹
Apache Kylin是一個開源的分佈式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規模數據,最初由eBay Inc. 開發並貢獻至開源社區.
常見的使用方法是將Kylin安裝到hadoop的客戶端機器上.
在平常使用場景, 上圖中的application能夠是Kylin的web系統. Kylin的web系統提供web化工具用於建立Cube,執行查詢和進行各類管理工做. Kylin的Web系統包含一個用於查詢支持的查詢引擎和一個用於Cube的構建引擎, 這兩個引擎會和Hadoop的組件進行交互,主要是hive和hbase.
環境介紹
Kylin推薦環境:
Hadoop: 2.4 - 2.7
Hive: 0.13 - 0.14
HBase: 0.98 - 0.99
JDK: 1.7+
我使用的環境:
Hadoop: cloudera 5.4.5, 包含MR, hive ,hbase組件
Kylin: Apache Kylin v1.2
安裝配置
1 從Kylin的站點下載頁面http://kylin.apache.org/download/ 獲取最新的安裝包(v1.2)
2 將安裝包解壓到相應目錄,並設置$KYLIN_HOME指向該目錄
3 確保你用於運行kylin的用戶擁有在shell中運行hadoop,hive和hbase的權限. 若是你沒法確認, 請運行 bin目錄下的check-env.sh來進行檢查, 若是你的環境存在問題, 檢查結果會打印出詳細信息, 以便於你定位問題.
4 若是須要定製化,請修改$KYLIN_HOME/conf/kylin.properties中的相應配置項
5 運行bin/kylin.sh start 來啓動kylin
6 若是須要中止kylin, 運行 bin/kylin.sh stop
7 訪問http://hostname:7070/kylin 以訪問Kylin Web App