MapReduce核心思想

定義:Mapreduce是一個分佈式運算程序的編程框架,是用戶開發「基於hadoop的數據分析應用」的核心框架。 特點:Mapreduce數據源是靜態的,每個MapReduce作業的輸出結果都會寫入磁盤,會產生磁盤IO。 1、分佈是的運算程序往往需要分成至少2個階段 2、第一階段的mapreduce併發運行,互不相干 3、mapreduce編程中只能包含一個map階段,一個reduce 階段。 4
相關文章
相關標籤/搜索