基於Hadoop生態圈的數據倉庫實踐 —— ETL(二)

2、使用Hive轉換、裝載數據 1. Hive簡介 (1)Hive是什麼         Hive是一個數據倉庫軟件,使用SQL讀、寫、管理分佈式存儲上的大數據集。它創建在Hadoop之上,具備如下功能和特色: 經過SQL方便地訪問數據,適合執行ETL、報表、數據分析等數據倉庫任務。 提供一種機制,給各類各樣的數據格式加上結構。 直接訪問HDFS的文件,或者訪問如HBase的其它數據存儲。 能夠經
相關文章
相關標籤/搜索