YARN上的計算框架大類概念

目前基於Hadoop2.0運行在YARN上的計算框架大類 1.離線計算框架:MapReduce 2.DAG計算框架:Tez 3.流式計算框架:Storm 4.內存計算框架:Spark     MapReduce: 將計算過程分成兩部分(Map和Reduce),輸入的數據集是靜態的,不能動態變化。 Map階段並行處理輸入數據(Map Task將數據寫的本地磁盤) Reduce階段對Map結果彙總(R
相關文章
相關標籤/搜索