數據倉庫Hive安裝部署及基本操做

Hive是基於Hadoop的一個數據倉庫工具,能夠將結構化的數據文件映射爲一張數據庫表,並提供簡單的SQL查詢功能,能夠將SQL語句轉換爲MapReduce任務進行運行。 其優勢是學習成本低,能夠經過類SQL語句快速實現簡單的MapReduce統計,沒必要開發專門的MapReduce應用,十分適合數據倉庫的統計分析。java Hive構建在基於靜態批處理的Hadoop之上,因爲Hadoop一般都有
相關文章
相關標籤/搜索