Hive概述、體系架構、分區、桶與傾斜、環境搭建

一、Hive介紹和架構 Hive 是基於Hadoop 的一個數據倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,並提供完整的SQL查詢功能,可以將SQL語句轉換爲MapReduce任務進行運行。其優點是學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計分析。 Hive 是建立在Hadoop上的數據倉庫基礎構架。它提
相關文章
相關標籤/搜索