從零自學Hadoop(23)：Impala介紹及安裝

時間 2019-12-04

標籤自學 hadoop impala 介紹安裝欄目 Hadoop 简体版

原文原文鏈接

閱讀目錄

本文版權歸mephisto和博客園共有，歡迎轉載，但須保留此段聲明，並給出原文連接，謝謝合做。html

文章是哥(mephisto)寫的，SourceLink網絡

序

上一篇，咱們講述了HBase的協處理器。架構

　下面咱們開始介紹Impala的介紹及安裝。oop

介紹

一：定義

　　Impala是Cloudera公司主導開發的新型查詢系統，它提供SQL語義，能查詢存儲在Hadoop的HDFS和HBase中的PB級大數據。和Hive相比，速度快了個數量級，具備很是好的交互式SQL執行。大數據

三：架構

　

Impala Daemonhtm

　　是Impala的核心進程，進程名叫作：impalad，運行在全部的數據節點上，能夠讀寫數據，並接收客戶端的查詢請求，並行執行來自集羣中其餘節點的查詢請求，將中間結果返回給調度節點。調用節點將結果返回給客戶端。blog

Impala Statestore索引

　　狀態管理進程，定時檢查The Impala Daemon的健康情況，協調各個運行impalad的實例之間的信息關係，Impala正是經過這些信息去定位查詢請求所要的數據，進程名叫作 statestored，在集羣中只須要啓動一個這樣的進程，若是Impala節點因爲物理緣由、網絡緣由、軟件緣由或者其餘緣由而下線，Statestore會通知其餘節點，避免查詢任務分發到不可用的節點上。進程

Impala Catalog Service開發

　　元數據管理服務，進程名叫作 catalogd，將數據表變化的信息分發給各個進程。

安裝

一：新增服務

　　

二：勾選Impala

　　

三：分配服務

　　

　　

四：存儲配置

　　

五：添加服務進行中

　　

六：添加完成

　　

　　

　　

--------------------------------------------------------------------

　　到此，本章節的內容講述完畢。