MapReduce任務學習系列

首先放一張官方圖片,大致瞭解下整個MapReduce的處理過程。 拋出如下疑問: 1、MapReduce的基本原理是什麼?即利用什麼機制來實現的任務拆分處理? 2、MapReduce任務執行過程是什麼?任務怎麼提交?如何運行?哪個組件或者模塊可以監控任務的運行狀態,比如YARN服務?數據存儲(原始數據、中間數據、輸出結果)依賴什麼基礎構件? 3、輸入數據怎麼進行切割分片?即所謂的input spl
相關文章
相關標籤/搜索