Apache Hive

1. Hive 簡介 1.1. 什麼是Hive Hive是基於Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,並提供類SQL查詢功能。 本質是將SQL轉換爲MapReduce程序。 主要用途:用來做離線數據分析,比直接用MapReduce開發效率更高。 1.2. 爲什麼使用Hive 直接使用Hadoop MapReduce處理數據所面臨的問題: 人員學習成本太高 MapR
相關文章
相關標籤/搜索