數據倉庫工具之hive介紹

Hive是基於hadoop的一個數據倉庫工具,能夠將結構化的數據文件映射爲一張數據庫表,並提供類SQL查詢功能。本質是將SQL轉換爲MapReduce程序。python hive的主要用途:用來作離線數據分析,比直接用MapReduce程序開發效率更高。mysql 直接使用MapReduce所面臨的問題: 人員學習成本過高:使用mr直接分析數據的前提是須要開發複雜的mapreduce程序,這對於數
相關文章
相關標籤/搜索