MapReduce的原理和運行流程

1:應用場景      1: 海量數據在單機上處理因爲硬件資源限制,無法勝任     2:而一旦將單機版程序擴展到集羣上分佈式運行,將極大增加程序複雜和開發難度     3:引入MapReduce程序後,開發人員可以將絕大部分工作集中在業務邏輯的開發上,而將分佈式計算中的複雜性交由框架來處理.     分佈式: 1:文件分佈式存儲HDFS 2:運算邏輯需要至少分成兩個階段(一個階段獨立開發,一個階
相關文章
相關標籤/搜索