【大數據日記】【轉】The world beyond batch: Streaming 101(第二節)

數據處理模式 現在我們可以開始講一些有界和無界數據處理的重要模式了:批量和流式,這裏我把微批歸類爲流式,因爲二者的區別不是很重要。 有界數據 處理有界數據很簡單,大家都很熟悉。在下圖中,左邊是一個數據集,使用一些數據處理引擎對它進行處理(典型的是批量處理,儘管一個設計良好的流式引擎也可以勝任),例如 MapReduce,右邊則是處理後的結果: 圖2:使用一個典型的批量引擎處理有界數據。左邊的有限的
相關文章
相關標籤/搜索