大數據之HIVE

HIVE 1.概述 Hive時Apache提供的一套基於Hadoop的用於進行數據倉庫操作的工具 Hive提供了類SQL語句來操作數據,在底層將SQL轉化爲MapReduce程序來執行,所以Hive的執行效率比較低,適合於離線分析。 每一個database,table會在HDFS上對應一個目錄 Hive中沒有主鍵 2.數據倉庫 數據倉庫的數據量>TB,數據庫<=GB 數據種類和來源,數據倉庫和來源
相關文章
相關標籤/搜索