Hadoop數據收集與入庫系統Flume與Sqoop

Hadoop提供了一箇中央化的存儲系統,其有利於進行集中式的數據分析與數據共享。 hadoop對存儲格式沒有要求。可以存儲用戶訪問日誌、產品信息以及網頁數據等數據。        常見的兩種數據來源。一種是分散的數據源:機器產生的數據、用戶訪問日誌以及用戶購買日誌。另一種是傳統系統中的數據:傳統關係型數據庫(MySQL、Oracle)、磁盤陣列以及磁帶。         Flume由三部分構成。M
相關文章
相關標籤/搜索