通過flume進行簡單的ETL工作

一般提起大數據的實時流處理,我們首先會想到複雜的storm spark  kafka 等等,但是如果只是針對單條記錄進行簡單的ETL運算,使用Flume+Morphlines不失爲一種優雅簡約的方法 flume是apache開源的項目,是一個分佈式的,可靠的軟件系統,主要是從大量的分散的數據源中收集,匯聚以及遷移大規模的日誌數據,最後存儲到一個集中的數據系統中。 flume是由運行在不同主機系統的
相關文章
相關標籤/搜索