Apache kylin的基礎環境

1、Apache kylin的基礎環境

因爲Apache kylin上的OLAP(wiki:OLAP)是構建在hadoop生態環境上的,因此hadoop環境的穩定性和健壯性對kylin的穩定運行相當重要。通常而言,Apache kylin實例最好部署在hadoop集羣的客戶端機器上;而經過hadoop客戶端機器,kylin最好能直接訪問hadoop、hdfs、hive、hbase等命令行腳本;另外,kylin進程實例的全部者,須要具有如下權限:apache

  • 讀/寫 hadoop分佈式文件系統。
  • 提交MR任務到hadoop集羣。
  • 建立/刪除hive表。
  • 建立hbase表。

以下圖:bash

如下是Apache kylin依賴環境的組件及版本推薦:服務器

  • Hadoop: 2.6 - 2.7
  • Hive: 0.13 - 1.2.1
  • HBase: 0.98 - 0.99, 1.x
  • JDK: 1.7+

2、Apache kylin的安裝部署

安裝:運維

  1. 下載最近版本的kylin:Apache Kylin,解壓。
  2. 在 ~/.bash_profile 中添加指向解壓後的kylin文件夾的KYLIN_HOME環境變量。
  3. 確保當前用戶能在命令行接口中訪問hadoop, hive , hbase 命令,若是你不肯定,可利用$KYLIN_HOME/bin/check-env.sh 驗證。

部署:分佈式

通常以集羣模式部署kylin,kylin實例進程是無狀態的,kylin實例運行的狀態信息保存在hbase和hdfs中(後面有單獨篇章講元數據)kylin實例有三種運行模式,決定了該實例的職責,以下:oop

  1. job,該實例做爲cube build engine運行。
  2. query, 該實例做爲query engine運行。
  3. all,該實例既可做爲query engine運行,也能夠做爲cube build engine 運行。

注意:kylin集羣只能有一個實例以 job 或者 all 模式運行 ,其他全部實例只能做爲 queryengine運行。一個典型的部署方式以下:ui

 

      以集羣模式部署kylin時,每一個kylin服務器實例的${HOME_KYLIN}/conf/kylin.properties文件中的如下兩個參數需注意:命令行

  1. kylin.rest.servers,提供查詢服務的kylin實例列表,如:kylin.rest.servers=hostname1:7070,hostname2:7070
  2. kylin.server.mode,kylin實例的運行模式,注意,只能有一個實例以 job或者 all 模式運行 ,其他全部實例只能以 query 模式運行。

3、Apache kylin的基礎運維

  1. 啓動實例
$KYLIN_HOME/bin/kylin.sh start

2.關閉實例rest

$KYLIN_HOME/bin/kylin.sh stop
相關文章
相關標籤/搜索