流式傳輸大數據:Storm,Spark和Samza

有許多分佈式計算系統可以實時或近實時處理大數據。 本文將從對三個Apache框架的簡短描述開始,並試圖對它們之間的某些相似之處和不同之處提供一個快速的高級概述。 阿帕奇風暴 在風暴 ,你設計要求的T opology實時計算的圖,然後喂到集羣,其中主節點將分發工作節點來執行它之間的代碼。 在拓撲中,數據在噴口之間傳遞, 噴口以不可變的鍵值對集(稱爲元組)的形式發射數據流,而螺栓則轉換這些流(計數,過
相關文章
相關標籤/搜索