大數據案例 -- 互聯網日誌實時收集和實時計算的簡單方案

原文: http://lxw1234.com/archives/2015/11/569.htm 整理:大數據肌肉猿 --- 作爲互聯網公司,網站監測日誌當然是數據的最大來源。我們目前的規模也不大,每天的日誌量大約1TB。後續90%以上的業務都是需要基於日誌來完成,之前,業務中對實時的要求並不高,最多也就是準實時(延遲半小時以上),因此,我們使用Flume將數據收集到HDFS,然後進行清洗和分析。
相關文章
相關標籤/搜索