使用Apache Spar 的Lambda架構

市場上很多玩家已經建造了MapReduce工作流用來日常處理兆兆字節的歷史數據。但是誰願意等待24小時來拿到更新後的分析報告?這篇博客會向你介紹Lambda Architecture,它被設計出來既可以利用批量處理方法,也可以使用流式處理方法。這樣我們就可以利用Apache Spark(核心, SQL, 流),Apache Parquet,Twitter Stream等工具處理實時流式數據,實現對
相關文章
相關標籤/搜索