數據倉庫學習之Hive和Impala

數據倉庫的概念:一個面向主題的、集成的、相對穩定的、可反映歷史變化的數據集合,用於支持管理決策。數據庫 Hive能夠理解爲是一種用戶編程接口,它自己並不直接存儲數據也不處理數據,而是經過接口的封裝和調用,經過Hadoop的組件進行相關操做的。經過Hive能夠很方便的將構建在關係數據庫上的數據倉庫稱讚到Hadoop上,而且經過HiveSQL運行MapReduce進行分佈式查詢計算。編程 Hive的特
相關文章
相關標籤/搜索