從零自學Hadoop(23):Impala介紹及安裝

閱讀目錄

本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文連接,謝謝合做。html

文章是哥(mephisto)寫的,SourceLink網絡

 

     上一篇,咱們講述了HBase的協處理器。架構

   下面咱們開始介紹Impala的介紹及安裝。oop

介紹

一:定義

  Impala是Cloudera公司主導開發的新型查詢系統,它提供SQL語義,能查詢存儲在Hadoop的HDFS和HBase中的PB級大數據。和Hive相比,速度快了個數量級,具備很是好的交互式SQL執行。大數據

三:架構

 

Impala Daemonhtm

  是Impala的核心進程,進程名叫作:impalad,運行在全部的數據節點上,能夠讀寫數據,並接收客戶端的查詢請求,並行執行來自集羣中其餘節點的查詢請求,將中間結果返回給調度節點。調用節點將結果返回給客戶端。blog

Impala Statestore索引

  狀態管理進程,定時檢查The Impala Daemon的健康情況,協調各個運行impalad的實例之間的信息關係,Impala正是經過這些信息去定位查詢請求所要的數據,進程名叫作 statestored,在集羣中只須要啓動一個這樣的進程,若是Impala節點因爲物理緣由、網絡緣由、軟件緣由或者其餘緣由而下線,Statestore會通知其餘節點,避免查詢任務分發到不可用的節點上。進程

Impala Catalog Service開發

  元數據管理服務,進程名叫作 catalogd,將數據表變化的信息分發給各個進程。

安裝

一:新增服務

  

二:勾選Impala

  

三:分配服務

  

  

四:存儲配置

  

五:添加服務進行中

  

 

六:添加完成

  

 

  

 

  

--------------------------------------------------------------------

  到此,本章節的內容講述完畢。

系列索引

  【源】從零自學Hadoop系列索引

 

 

 

 

本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文連接,謝謝合做。

文章是哥(mephisto)寫的,SourceLink

相關文章
相關標籤/搜索