大數據入門-Hive學習從這裏開始

Hive是基於Hadoop HDFS分佈式文件系統的分佈式數據倉庫架構。它爲數據倉庫的管理提供了許多功能:數據ETL(抽取、轉換和加載)工具,數據存儲管理和大型數據集的查詢和分析能力。同時Hive還定義了類SQL的語言(HiveQL)。允許用戶進行和SQL相似的操作,它可以將結構化的數據文件映射爲一張數據庫表,並提供簡單的SQL查詢功能。還允許開發人員方便的使用Mapper和Reducer操作,可
相關文章
相關標籤/搜索