hive 資料整理系列一 入門

Hive是Hadoop項目中的一個子項目,由FaceBook向Apache基金會貢獻,其中TaoBao也是其中一位使用者+貢獻者,Hive被視爲一個倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,並可以將sql語句轉換爲 MapReduce 任務進行運行。 其優點是學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計
相關文章
相關標籤/搜索