數據倉庫工具之hive介紹

Hive是基於hadoop的一個數據倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,並提供類SQL查詢功能。本質是將SQL轉換爲MapReduce程序。 hive的主要用途:用來做離線數據分析,比直接用MapReduce程序開發效率更高。 直接使用MapReduce所面臨的問題: 人員學習成本太高:使用mr直接分析數據的前提是需要開發複雜的mapreduce程序,這對於數據倉庫的受衆羣體來說,
相關文章
相關標籤/搜索